当两个pandas数据帧包含重复键时，如何使用left join合并两个pandas数据帧？

left = pd.DataFrame({'key1': ['K0', 'K0', 'K1', 'K1', 'K1', 'K1', 'K2'], 'key2': ['K0', 'K1', 'K0', 'K0', 'K0', 'K0', 'K1'], 'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5', 'A6'], 'B': ['B0', 'B1', 'B2', 'B3', 'B4', 'B5', 'B6']}) right = pd.DataFrame({'key1': ['K0', 'K1', 'K1', 'K2'], 'key2': ['K0', 'K0', 'K0', 'K0'], 'C': ['C0', 'C1', 'C2', 'C3'], 'D': ['D0', 'D1', 'D2', 'D3']}) print left A B key1 key2 0 A0 B0 K0 K0 1 A1 B1 K0 K1 2 A2 B2 K1 K0 3 A3 B3 K1 K0 4 A4 B4 K1 K0 5 A5 B5 K1 K0 6 A6 B6 K2 K1 print right C D key1 key2 0 C0 D0 K0 K0 1 C1 D1 K1 K0 2 C2 D2 K1 K0 3 C3 D3 K2 K0

result.drop_duplicates(subset = ['A','B','key1','key2'], inplace=True) print result A B key1 key2 C D 0 A0 B0 K0 K0 C0 D0 1 A1 B1 K0 K1 NaN NaN 2 A2 B2 K1 K0 C1 D1 4 A3 B3 K1 K0 C1 D1 6 A4 B4 K1 K0 C1 D1 8 A5 B5 K1 K0 C1 D1 10 A6 B6 K2 K1 NaN NaN

A B key1 key2 C D 0 A0 B0 K0 K0 C0 D0 1 A1 B1 K0 K1 NaN NaN 2 A2 B2 K1 K0 C1 D1 3 A3 B3 K1 K0 C2 D2 4 A4 B4 K1 K0 NaN Nan 5 A5 B5 K1 K0 NaN Nan 6 A6 B6 K2 K1 NaN NaN

1条回答

网友

1楼 · 发布于 2024-10-11 16:26:52

不幸的是，你的问题并没有描述你想要达到什么样的目标，因为它对任何有类似问题的人都是有用的。在

实际上，您希望为重复的合并键获得排序合并。在

继续的逻辑方法是add a sequence number使合并的多个键唯一。接下来是一个小的合并。在

left['Order'] = left.groupby(['key1','key2']).cumcount()
right['Order'] = right.groupby(['key1','key2']).cumcount()

result = left.merge(right, how='left', 
                    on=['key1','key2','Order']).drop('Order',axis=1)

相关问题更多 >

编程相关推荐

热门问题

热门文章