擅长:python、mysql、java
<p>您可以使用python的库<code>pandas</code>来实现:</p>
<p>为每个<code>.txt</code>文件创建数据帧,如下所示:</p>
<pre><code>In [2017]: df_A = pd.read_fwf('/home/mayankp/Documents/Personal/stackoverflow/A.txt', header=None)
In [2018]: df_A
Out[2018]:
0
0 AAB
1 BBC
2 DDE
3 GGC
In [2019]: df_B = pd.read_fwf('/home/mayankp/Documents/Personal/stackoverflow/B.txt', header=None)
In [2020]: df_B
Out[2020]:
0
0 123
1 AAB
2 DDE
3 345
4 GHY
5 GJK
</code></pre>
<p>现在,<code>merge</code>两个数据帧(如内部连接)只找出两者之间的公共行</p>
<pre><code>In [2021]: df_C = pd.merge(df_A, df_B, on=0, how='inner')
Out[2021]: df_C
0
0 AAB
1 DDE
</code></pre>
<p>然后,您可以将此输出写入如下文件:</p>
<pre><code>In [2023]: df_C.to_csv('out.csv', index=False)
</code></pre>
<p>这将是有效的,因为不需要循环,也不需要编写复杂的正则表达式。代码变得更干净、更简单</p>
<p>如果这有帮助,请告诉我</p>