按条件分组

2024-09-27 00:12:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我在处理我的数据。 这是我的数据。你知道吗

enter image description here

我这样写代码。你知道吗

complete_data = complete_data.groupby(['STDR_YM_CD', 'TRDAR_CD' ]).sum().reset_index()

在执行代码之后,我得到了如下图所示的数据帧

enter image description here

但是我想根据SVC\u industy\u CD列中字符的前三个字母聚合值,如下图所示。你知道吗

enter image description here

这是我的数据链 http://blogattach.naver.com/c356df6c7f2127fbd539596759bfc1bd1848b453f1/20170316_215_blogfile/khm2963_1489653338468_dtPz6k_csv/test2.csv?type=attachment

提前谢谢


Tags: csv数据代码dataindexcdcompletereset
1条回答
网友
1楼 · 发布于 2024-09-27 00:12:41

我相信有更好的方法,但这是一种方法:

complete_data['first_three_temp'] = complete_data['SVC_INDUTY_CD'].str[:3]
complete_data = complete_data.groupby(['STDR_YM_CD', 'TRDAR_CD', 'first_three_temp' ], as_index=False).sum()
complete_data.drop('first_three_temp', axis=1, inplace=True)

这将添加一个仅包含SVC\u industy\u CD列的前三个字符的临时列。然后可以按groupby on并删除临时列。正如我所说,我确信有一种更有效的方法,所以我不确定您是否会受到数据集大小的限制。你知道吗

相关问题 更多 >

    热门问题