"转行值为列，并计算所有可能值的重复次数mysq"

+---------+---------+---------+-----+ | email | val1 | val2 | val3 | +---------+---------+---------+-----+ |jal@h | cast | core | cam | |hal@b |little ja| qar | ja sa | |bam@t | cast | core | cam | |jal@h |little ja| qar | jaja | +---------+---------+---------+-----+

+-------+--------+--------+------+----------+-----+--------+-------+ | email | cast | core | cam | little ja| qar | ja sa | blabla | +-------+--------+--------+------+----------+-----+--------+--------| |jal@h | 55 | 2 | 44 | 244 | 1 | 200 | 12 | |hal@b | 900 | 513 | 101 | 146 | 2 | 733 | 833 | |bam@t | 1231 | 33 | 433 | 411 | 933 | 833 | 53 | +-------+--------+--------+------+----------+-----+--------+---------

+-------+--------+---------+------+----------+-----+--------+-------+ | | val1 | val2 | val3 | +-------+--------+---------+------+----------+-----+--------+-------+ | email | cast |little ja|core | qar |cam | ja sa | jaja | +-------+--------+---------+------+----------+-----+--------+--------| |jal@h | 55 | 2 | 44 | 244 | 1 | 200 | 12 | |hal@b | 900 | 513 | 101 | 146 | 2 | 733 | 833 | |bam@t | 1231 | 33 | 433 | 411 | 933 | 833 | 53 | +-------+--------+--------+------+----------+-----+--------+---------

3条回答

网友
1楼 · 编辑于 2024-09-28 19:34:29

我将重建数据帧，然后分组并用pd.value_counts取消堆栈
v = df.values s = pd.Series(v[:, 1:].ravel(), v[:, 0].repeat(3)) s.groupby(level=0).value_counts().unstack(fill_value=0) cam cast core ja sa jaja little ja qar bam@t 1 1 1 0 0 0 0 hal@b 0 0 0 1 0 1 1 jal@h 1 1 1 0 1 1 1

网友
2楼 · 编辑于 2024-09-28 19:34:29

如果您使用pandas，则可以在通过电子邮件将数据帧分组后执行value_counts，然后unstack/pivot将其转换为宽格式：
(df.set_index("email").stack().groupby(level=0).value_counts() .unstack(level=1).reset_index().fillna(0))
要获得更新的结果，您可以按stack后面的email和val*列进行分组：
(df.set_index("email").stack().groupby(level=[0, 1]).value_counts() .unstack(level=[1, 2]).fillna(0).sort_index(axis=1))

网友
3楼 · 编辑于 2024-09-28 19:34:29

如果知道列表，可以使用group by计算：

SELECT email,
       sum(val1 = 'cast') as `cast`,
       sum(val1 = 'core') as `core`,
       sum(val1 = 'cam') as `cam`,
       . . .
FROM table1
GROUP BY email;

. . .用于填充剩余的值。你知道吗

相关问题更多 >

编程相关推荐

热门问题

热门文章