我正在两个数据帧上执行外部联接:
df1 = pd.DataFrame({'id': [1, 2, 3, 4, 5],
'date': [4, 5, 6, 7, 8],
'str': ['a', 'b', 'c', 'd', 'e']})
df2 = pd.DataFrame({'id': [1, 2, 3, 4, 6],
'date': [4, 5, 6, 7, 8],
'str': ['A', 'B', 'C', 'D', 'Q']})
pd.merge(df1, df2, on=["id","date"], how="outer")
这就是结果
date id str_x str_y
0 4 1 a A
1 5 2 b B
2 6 3 c C
3 7 4 d D
4 8 5 e NaN
5 8 6 NaN Q
是否可以执行外部联接,以便将str
列连接起来?换句话说,如何执行连接以获得数据帧
date id str
0 4 1 aA
1 5 2 bB
2 6 3 cC
3 7 4 dD
4 8 5 e
5 8 6 Q
其中所有NaN
都被设置为None
如果
'id', 'date'
在每个数据帧中是唯一的,那么可以设置索引并添加数据帧我认为不是,可能的解决方案是替换
NaN
并连接在一起:类似替代方案:
相关问题 更多 >
编程相关推荐