根据自定义规则将数据帧与

data1 = {'one':['A', 'E', 'G'], 'two':['B', 'D', 'H'], 'three':['C', 'F', 'J']} df1 = pd.DataFrame(data1) df1 one two three 0 A B C 1 E D F 2 G H J data2 = {'one':['C', 'F', 'P'], 'two':['B', 'D', 'R'], 'three':['A', 'E', 'C']} df2 = pd.DataFrame(data2) df2 one two three 0 C B A 1 F D E 2 P R C

2条回答

网友

1楼 · 编辑于 2024-09-28 17:05:43

简单地说，只需比较您希望相同的列并对其进行筛选。在您的示例中：

pd.concat([df.loc[df1["two"] != df2["two"]] for df in (df1, df2)], axis=0)

编辑：如果您还需要“发件人”列，请将上面的行更改为：

pd.concat([df.loc[df1["two"] != df2["two"]].assign(from_df=df_name) for df, df_name in zip((df1, df2), ("df1", df2)], axis=0)

网友

2楼 · 编辑于 2024-09-28 17:05:43

使用^{}

df1.set_index(df1.apply(frozenset, 1), inplace=True)
df2.set_index(df2.apply(frozenset, 1), inplace=True)

df1['from'] = 'df1'
df2['from'] = 'df2'

new_df = pd.concat([df1, df2]).loc[df1.index ^ df2.index].reset_index(drop=True)

print(new_df)

输出：

  one three two from
0   G     J   H  df1
1   P     C   R  df2

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据自定义规则将数据帧与

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >