Python中列联表部分的选取

2024-10-04 07:25:37 发布

您现在位置：Python中文网/ 问答频道 /正文

9107

网友

男 | 程序猿一只，喜欢编程写python代码。

问题

我正在做一个项目，试图检测数据集中存在的性别歧视和性别之间的关联。数据集的一部分看起来像

    male  female  sexism?
0      0       1        1
1      1       1        0
2      0       1        1
3      1       1        1
4      1       1        0
..   ...     ...      ...

现在我想得到这个数据集的统计数据

       sexism   non-sexism
male   xxx      xxx
female xxx      xxx

据我所知，我可以使用pd.crosstab做一些类似的事情（请参阅下面的代码块），但这并不像我预期的那么简单

pd.crosstab([[df["male"], df["sexism?"]], [[df["female"], df["sexism?"]])

有人能帮我吗？提前谢谢

Tags：数据项目代码 df 请参阅事情 male female

1条回答

网友

1楼 · 发布于 2024-10-04 07:25:37

我想你应该看看这个百分比

df.groupby('sexism?').mean().T
Out[19]: 
sexism?    0         1
male     1.0  0.333333
female   1.0  1.000000

更新

df.groupby('sexism?').sum().T
Out[9]: 
sexism?  0  1
male     2  1
female   2  3

Python中列联表部分的选取

问题

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python中列联表部分的选取

问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >