在Pandas中保留同一ID出现超过n次的行，并转换为每个ID的list

VID value 1 1 xx 2 2 xx1 3 2 xx2 4 2 xx3 5 2 xx4 6 3 xx 7 3 xx 8 3 xx 9 4 zz1 10 4 zz2 11 4 zz3 12 4 zz4 13 4 zz5

1条回答

网友

1楼 · 发布于 2024-09-27 23:19:11

您可以按VID列分组，然后计算每个组的计数。然后在这之后，使用它来索引原始的df，以便只获取计数大于3的行。示例-

countdf = df.groupby('VID').count()
result = df.loc[df['VID'].isin(countdf[countdf['value'] > 3].index)]

演示-

^{pr2}$

然后，您可以再次基于VID分组，然后将这些分组转换为list，然后再转换为list，例如-

resultlist = result.groupby('VID')['value'].apply(list).tolist()

演示-

In [54]: result = df.loc[df['VID'].isin(countdf[countdf['value'] > 3].index)]

In [55]: result.groupby('VID')['value'].apply(list).tolist()
Out[55]: [['xx1', 'xx2', 'xx3', 'xx4'], ['zz1', 'zz2', 'zz3', 'zz4', 'zz5']]

请注意，上面不会给你列表中的'end'值，我猜这是没有必要的，但是如果你真的想要，你可以在得到列表后手动添加它。示例-

resultlist = [elem + ['end'] for elem in resultlist]

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Pandas中保留同一ID出现超过n次的行，并转换为每个ID的list

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >