序列化Python类别相关矩阵'

2024-06-02 12:55:52 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一些数据为一个慈善机构,其中包括捐款金额和捐款人的一些信息如下。在

性别年龄国家捐赠金额

F 25英国15

F 65法国80

M 55德国54

F 41英国3

M 74法国99

我想找出哪些栏目与捐赠金额最密切相关,以便我可以进一步调查,例如,某些国家的捐赠额与其他国家相比很大,因此有针对性地进行调查是很好的。这是很容易做到的熊猫.corr()函数,但这不适用于分类数据,如性别,只有数字数据,如年龄。在

有人知道我能做这件事吗?在

我读过关于使用熊猫。去拿假人()将分类变量转换为虚拟/指标变量。问题是我有很多专栏,其中几个专栏有超过40个不同的人口统计类别,所以这个get非常大,非常快,很难解释(至少我一直是这样做的!)。在

我还发现这篇文章是说您可以使用spearmanr,但在其他地方也看到了不应该将spearmanr用于分类数据。这个熊猫.corr(method=spearman)方法也不适用于分类数据。 (^ a1)

这是我的第一个帖子,如果我没有很好地解释自己,我很抱歉!请让我知道,我会纠正任何需要。在


Tags: 数据函数信息分类国家金额性别年龄