基于聚合计数对数据帧的行进行排序，并随机获得一行

2条回答

网友

1楼 · 编辑于 2024-06-28 19:09:31

以下是如何做到这一点：

1）使用Series.value_counts创建一个helper系列来获取顺序

2）用这个helper系列索引您的原始df并删除重复的col1值。你知道吗

s = df.col1.value_counts()
df.set_index('col1').loc[s.index].reset_index().drop_duplicates('col1')

或在一行中：

df2 = (df.set_index('col1')
       .loc[df.col1.value_counts().index]
       .reset_index()
       .drop_duplicates('col1'))

[输出]

    col1    col2    col3    col4    col5
0   a       a1      foo1    foo2    foo3
3   b       b1      foo4    foo5    foo6
5   c       c1      foo7    foo8    foo9

网友

2楼 · 编辑于 2024-06-28 19:09:31

下面是一个非常简单的方法，首先按col1排序，然后删除重复项：

import pandas as pd
df = pd.read_csv('funky.csv')
df.sort_values('col1', ascending=True, inplace=True)
df

第1部分的输出：

  col1 col2   col3   col4   col5
0    a   a1   foo1   foo2   foo3
3    a   a2  foo10  foo11  foo12
4    a   a3  foo13  foo14  foo15
1    b   b1   foo4   foo5   foo6
5    b   b2  foo16  foo17  foo18
2    c   c1   foo7   foo8   foo9

然后只需在第1列中删除重复项：

df2 = df.drop_duplicates(['col1'])
df2

输出：

  col1 col2  col3  col4  col5
0    a   a1  foo1  foo2  foo3
1    b   b1  foo4  foo5  foo6
2    c   c1  foo7  foo8  foo9

相关问题更多 >

编程相关推荐

热门问题

热门文章

基于聚合计数对数据帧的行进行排序，并随机获得一行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >