我有一个问卷的数据集,有数字的,MCQ单次回答和MCQ多个回答。在那里共22列。数据集如下所示:
Age ChooseTransport WillgobyTrain ....
52 1011001 2
21 1000100 1
25 1110000 1
46 0001000 -1
32 1000001 2
“年龄”是一个数字变量choosettransport'是MCQ-有7个选项的多个响应,其中1表示用户已选择该选项,如果未选择,则为0WillgobyTrain'是一个MCQ单响应,有选择号。在
我想找到正确的测量方法来找出这些不同类型变量之间的相关性。在
首先,您应该将
ChooseTransport
拆分为7个列,然后尝试使用data.corr()
(如果您的数据是pandas.DataFrame
)。在要拆分
ChooseTransport
请尝试以下操作:然后删除旧列
^{pr2}$ChooseTransport
:最后使用
data.corr()
:可视化使用
seaborn
:相关问题 更多 >
编程相关推荐