使用python的文本文件行的交集

Type A1 A2 A3 A4 A5 Tag TagA1 TagA1 TagA1 TagA2 TagA2 object1 1.1 2.1 3.1 4.1 5.1 object2 1.2 2.2 3.2 4.2 5.2 object4 1.4 2.4 3.4 4.4 5.4 object7 1.7 2.7 3.7 4.7 5.7 object8 1.8 2.8 3.8 4.8 5.8 object9 1.9 2.9 3.9 4.9 5.9

Type C1 C2 C3 C4 Tag TagC1 TagC1 TagC2 TagC2 object1 21.1 22.1 23.1 24.1 object4 21.4 22.4 23.4 24.4 object5 21.5 22.5 23.5 24.5 object6 21.6 22.6 23.6 24.6 object7 21.7 22.7 23.7 24.7 object9 21.9 22.9 23.9 24.9

Type A1 A2 A3 A4 A5 B1 B2 C1 C2 C3 C4 Tag TagA1 TagA1 TagA1 TagA2 TagA2 TagB1 TagB2 TagC1 TagC1 TagC2 TagC2 object1 1.1 2.1 3.1 4.1 5.1 11.1 12.1 21.1 22.1 23.1 24.1 object4 1.4 2.4 3.4 4.4 5.4 11.4 12.4 21.4 22.4 23.4 24.4 object7 1.7 2.7 3.7 4.7 5.7 11.7 12.7 21.7 22.7 23.7 24.7 object9 1.9 2.9 3.9 4.9 5.9 11.9 12.9 21.9 22.9 23.9 24.9

2条回答

网友

1楼 · 编辑于 2024-09-28 13:18:23

正如@Jamin所评论的那样，您可以直接使用join='inner'来保持最安全的一面，而不会丢失nan，即

df_m = pd.concat([A,B,C],axis=1,join='inner')

您还可以使用concat和dropna，dropna将删除缺少值的行，这样您只剩下在所有文件中找到的行，即

^{pr2}$

如果您确认每个数据帧中都没有nan，那么这个解决方案仍然有效。在

网友

2楼 · 编辑于 2024-09-28 13:18:23

使用^{}-

from functools import reduce
dfs = [df1, df2, df3]
df_final = reduce(lambda left,right: pd.merge(left,right,on=None,left_index=True,right_index=True), dfs)

或

^{pr2}$

这给了你一个简单的方法用钥匙连接-

   Type       A1    A2    A3    A4    A5    B1    B2    C1    C2    C3    C4
    Tag     TagA1 TagA1 TagA1 TagA2 TagA2 TagB1 TagB2 TagC1 TagC1 TagC2 TagC2
    object1   1.1   2.1   3.1   4.1   5.1  11.1  12.1  21.1  22.1  23.1  24.1
    object4   1.4   2.4   3.4   4.4   5.4  11.4  12.4  21.4  22.4  23.4  24.4
    object7   1.7   2.7   3.7   4.7   5.7  11.7  12.7  21.7  22.7  23.7  24.7
    object9   1.9   2.9   3.9   4.9   5.9  11.9  12.9  21.9  22.9  23.9  24.9

计时

@黑暗

2.63 ms ± 598 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

@维维克

2.9 ms ± 252 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

@Vivek（第二个-使用join）

5.4 ms ± 662 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

由于按键操作没有任何麻烦，@Dark的解决方案效率略高一些。但由于OP提到只包含这三个文件中存在的那些行（从第3行开始），所以我使用了merge的方式，而不是concat的方式

相关问题更多 >

编程相关推荐

热门问题

热门文章