使用Dataframe为每个人创建多行，为每个人创建一行，并获取某个属性的模式（每个人）

fName lName smokes eye_color Bob McCain 1 black Bob McCain 0 black Bob McCain 1 black Ryan Diedre 0 brown Ryan Diedre 0 brown Ryan Diedre 1 brown John Madden 1 green John Madden 0 green

3条回答

网友

1楼 · 编辑于 2024-06-24 12:41:39

可以使用groupby，然后使用pd.Series.mode：

def filt(x):
    return x.iat[0] if len(x.mode())>1 else x.mode()

df.groupby(['fName', 'lName'], as_index=False).agg({'smokes': filt, 'eye_color': 'first'})

   fName    lName   smokes  eye_color
0   Bob     McCain   1       black
1   John    Madden   1       green
2   Ryan    Diedre   0       brown

pd.Series.mode返回最频繁的值

网友

2楼 · 编辑于 2024-06-24 12:41:39

对第一个值使用^{}，因为它应该返回2个值并且只需要一个值，对于eye_color，如果每个组的所有值都相同，则使用^{}：

df1 = (df.groupby(['fName','lName'])
         .agg({'smokes': lambda x: x.mode().iat[0], 'eye_color':'first'})
         .reset_index())

如果每个组的两列中都需要最频繁的值：

df1 = (df.groupby(['fName','lName'])
         .agg({'smokes': lambda x: x.mode().iat[0], 'eye_color':lambda x: x.mode().iat[0]})
         .reset_index())
print (df1)
  fName   lName  smokes eye_color
0   Bob  McCain       1     black
1  Ryan  Diedre       0     brown

网友

3楼 · 编辑于 2024-06-24 12:41:39

试试groupby：

>>> df.groupby('fName', as_index=False).apply(lambda x: x.mode()).reset_index(level=1).iloc[:, 1:]
  fName   lName  smokes eye_color
0   Bob  McCain       1     black
1  Ryan  Diedre       0     brown
>>>

相关问题更多 >

编程相关推荐

热门问题

热门文章

使用Dataframe为每个人创建多行，为每个人创建一行，并获取某个属性的模式（每个人）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >