Python中列联表部分的选取

2024-10-04 07:25:37 发布

您现在位置:Python中文网/ 问答频道 /正文

问题

我正在做一个项目,试图检测数据集中存在的性别歧视和性别之间的关联。数据集的一部分看起来像

    male  female  sexism?
0      0       1        1
1      1       1        0
2      0       1        1
3      1       1        1
4      1       1        0
..   ...     ...      ...

现在我想得到这个数据集的统计数据

       sexism   non-sexism
male   xxx      xxx
female xxx      xxx

据我所知,我可以使用pd.crosstab做一些类似的事情(请参阅下面的代码块),但这并不像我预期的那么简单

pd.crosstab([[df["male"], df["sexism?"]], [[df["female"], df["sexism?"]])

有人能帮我吗?提前谢谢


Tags: 数据项目代码df请参阅事情malefemale
1条回答
网友
1楼 · 发布于 2024-10-04 07:25:37

我想你应该看看这个百分比

df.groupby('sexism?').mean().T
Out[19]: 
sexism?    0         1
male     1.0  0.333333
female   1.0  1.000000

更新

df.groupby('sexism?').sum().T
Out[9]: 
sexism?  0  1
male     2  1
female   2  3

相关问题 更多 >