在pandas datafram中使用group by函数时找不到列名

Country City POI Type 0 NL Amsterdam KFC restaurant 1 NL Amsterdam KFC cafe 2 NL Arnhem McDonalds fast food 3 NL Arnhem McDonalds ice cream

import pandas as pd import numpy as np data = np.array([['','Country','City', 'POI', 'Type'], [0,"NL","Amsterdam", 'KFC', 'cafe'], [1,"NL","Amsterdam", 'KFC', 'restaurant'], [2,"NL","Arnhem", 'McDonalds', 'fast-food'], [3,"NL","Arnhem", 'McDonalds', 'ice cream']] ) initial_df = pd.DataFrame(data=data[1:,1:], index=data[1:,0], columns=data[0,1:]) final_df = initial_df .groupby( [ "Country", "City", "POI", "Type"] ).count() print(list(final_df.columns.values)) print(final_df.shape)

2条回答

网友

1楼 · 编辑于 2024-10-01 15:44:09

您可以分组到str.join：

res = df.groupby(['Country', 'City', 'POI'])['Type'].apply(', '.join).reset_index()

print(res)

  Country       City        POI                Type
0      NL  Amsterdam        KFC    restaurant, cafe
1      NL     Arnhem  McDonalds  fastfood, icecream

网友

2楼 · 编辑于 2024-10-01 15:44:09

您的final_df为空，因为您要求pandas按所有列分组。如果您只想按列分组"Type"请执行以下操作：

grouped = initial_df .groupby( ["Type"] )

然后将count()函数应用于分组的数据帧。这将为每个组计算每列中非nan元素的实例。但是你想做的是访问每个组。您可以这样做：

^{pr2}$

希望这有帮助。在

相关问题更多 >

编程相关推荐

热门问题

热门文章