在不复制列的情况下合并多个数据帧

import pandas as pd # Initialize roster data = [['ab10', 'Ann Big'], ['ca9', 'Carl Ahn'], ['jb19', 'John Brown'], ['cf25', 'Carol Fox']] roster = pd.DataFrame(data, columns = ['ID', 'Name']) # Initialize the section grades data = [['ab10', 95], ['ca9', 72]] grades0 = pd.DataFrame(data, columns = ['ID', 'Exp1']) data = [['ab10', 83], ['ca9', 97]] grades1 = pd.DataFrame(data, columns = ['ID', 'Exp2']) data = [['jb19', 61], ['cf25', 95]] grades2 = pd.DataFrame(data, columns = ['ID', 'Exp1']) # Now merge the section grades with the roster to generate final gradebook roster = roster.merge(grades0, on = 'ID', how = 'outer') roster = roster.merge(grades1, on = 'ID', how = 'outer') roster = roster.merge(grades2, on = 'ID', how = 'outer') print(roster)

ID Name Exp1_x Exp2 Exp1_y 0 ab10 Ann Big 95.0 83.0 NaN 1 ca9 Carl Ahn 72.0 97.0 NaN 2 jb19 John Brown NaN NaN 61.0 3 cf25 Carol Fox NaN NaN 95.0

2条回答

网友

1楼 · 编辑于 2024-09-26 22:50:06

`reduce`与`combine_first`

由于等级数据帧之间没有重复，因此我们可以使用reduce和combine_first将所有数据帧组合在一起

from functools import reduce

reduce(pd.DataFrame.combine_first, 
      [g.set_index('ID') for g in (roster, grades0, grades1, grades2)])

      Exp1  Exp2        Name
ID                          
ab10  95.0  83.0     Ann Big
ca9   72.0  97.0    Carl Ahn
cf25  95.0   NaN   Carol Fox
jb19  61.0   NaN  John Brown

网友

2楼 · 编辑于 2024-09-26 22:50:06

我喜欢使用pd.concat()和.groupby()来处理这些情况，我相信这不仅可以使结果更干净，而且还可以节省几行代码，而且可能会提高效率（因为您不会进行多次合并）。将合并行替换为：

roster = pd.concat([roster,grades0,grades1,grades2]).groupby(['ID'])['Exp1','Exp2'].sum().merge(roster,on='ID')
print(roster)

哪些产出：

    ID  Exp1  Exp2        Name
0  ab10  95.0  83.0     Ann Big
1   ca9  72.0  97.0    Carl Ahn
2  cf25  95.0   0.0   Carol Fox
3  jb19  61.0   0.0  John Brown

然后，可以将列重新排序为首选顺序。如果您喜欢将NaNs添加到0，那么可以在merge()之后添加.replace(0,np.nan)

     ID  Exp1  Exp2        Name
0  ab10  95.0  83.0     Ann Big
1   ca9  72.0  97.0    Carl Ahn
2  cf25  95.0   NaN   Carol Fox
3  jb19  61.0   NaN  John Brown

`reduce`与`combine_first`

相关问题更多 >

编程相关推荐

热门问题

热门文章