假设我有关于市长和面包师姓名的城市的数据(如果有):
city name_mayor age_mayor name_baker age_baker
0 Cherbourg Robert 10 Jack 40
1 Calais Michel 20 Russel 50
2 Nevers Guy 30 None None
然后,我想创建一个新的数据框架来处理个人,因此我想要这样一个数据框架:
city name age
0 Cherbourg Robert 10
1 Calais Michel 20
2 Nevers Guy 30
3 Cherbourg Jack 40
4 Calais Russel 50
那么,计算平均年龄之类的东西就更容易了
谁能告诉我:
基本上,我可以通过行上的迭代来完成,但我了解到,使用其他方式处理pandas通常更好(如这里所述:How to iterate over rows in a DataFrame in Pandas)
我对熊猫并不陌生,但仍然停留在一种“numpy数组”的思维方式中
如果需要,这里是我如何制作我的两个示例:
data_1 = { "city" : ["Cherbourg", "Calais", "Nevers"], "name_mayor" : ["Robert", "Michel", "Guy"], "age_mayor" : [10,20,30], "name_baker" : ["Jack", "Russel"], "age_baker" : [40,50]}
df_1 = pd.DataFrame.from_dict(data_1, orient='index').transpose()
data_2 = {0:["Cherbourg", "Robert", 10], 1:["Calais", "Michel", 20], 2:["Nevers", "Guy", 30], 3:["Cherbourg", "Jack", 40], 4:["Calais", "Russel", 50] }
df_2 = pd.DataFrame.from_dict(data_2, orient='index', columns=["city", "name", "age"])
谢谢! R
下面是使用
concat
的另一种方法:大多数情况下,使用panda时,最好使用其build-it方法修改阵列:
输出:
您可以尝试使用^{}
相关问题 更多 >
编程相关推荐