如何找出数值、范畴(mcq单反应)和(mcq多重反应)之间的相关性?

2024-09-20 23:01:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个问卷的数据集,有数字的,MCQ单次回答和MCQ多个回答。在那里共22列。数据集如下所示:

Age    ChooseTransport   WillgobyTrain  ....
52      1011001                 2
21      1000100                 1
25      1110000                 1
46      0001000                -1
32      1000001                 2

“年龄”是一个数字变量choosettransport'是MCQ-有7个选项的多个响应,其中1表示用户已选择该选项,如果未选择,则为0WillgobyTrain'是一个MCQ单响应,有选择号。在

我想找到正确的测量方法来找出这些不同类型变量之间的相关性。在


Tags: 数据用户类型age选项数字问卷年龄
1条回答
网友
1楼 · 发布于 2024-09-20 23:01:10

首先,您应该将ChooseTransport拆分为7个列,然后尝试使用data.corr()(如果您的数据是pandas.DataFrame)。在

要拆分ChooseTransport请尝试以下操作:

for row_index, answer in enumerate(data['ChooseTransport']):
    for i in range(7):
        name = 'ChooseTransport_' + str(i)
        data.loc[row_index, name] = int(answer[i])

然后删除旧列ChooseTransport

^{pr2}$

最后使用data.corr()

data.corr()  

可视化使用seaborn

import seaborn as sns
sns.heatmap(data.corr())

相关问题 更多 >

    热门问题