Python pandas:按条件累积数据帧行

2024-09-27 23:24:46 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个包含两列的数据帧,格式如下:

Anna         15
Mary         14
Elizabeth    11
Margaret     10
Alice         6
Bertha        5
Helen         5
Emily         4
Maria         4
Marie         4
Catherine     4
Marion        4
Ellen         4
Florence      4
Augusta       4
...
Juliette      1
Mara          1
Elise         1
Alfrida       1
Nourelain     1
Margaretta    1
Manca         1
Aloisia       1
Hulda         1
Clear         1
Wendla        1
Ellis         1
Lulu          1
Juliet        1
Gertrude      1

如何用value < 5累加行以获得类似

安娜15 玛丽14 伊丽莎白11 玛格丽特10 爱丽丝6 泊位5 海伦5 其他50


Tags: 数据格式helenalicemaryannamariaemily
1条回答
网友
1楼 · 发布于 2024-09-27 23:24:46

有一种方法:

# create some random data
df =pd.DataFrame({'letter': list('qwertyuiopasdfghjklzxcvbnm'),'value': np.random.randint(1,15,26)})

定义一个函数,将value<;5替换为other:

^{pr2}$

将函数应用于数据帧:

df['letter'] =df.apply(f,axis=1)

按新字母列和总和分组:

df.groupby('letter').sum()

相关问题 更多 >

    热门问题