在python中比较两个文件并重新排序列问题的回答

在python中比较两个文件并重新排序列

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有两份档案。一个文件有一些ID，另一个有一对ID。你知道吗 所以file1看起来像： <pre><code>abc3756968 abc9483504 </code></pre> 文件2看起来像： <pre><code>abc6917833 abc3756968 0.817637 abc6920271 abc3756968 0.984551 abc4275081 abc3756968 0.834717 abc2209154 **abc3756968** 0.8642 abc10457594 **abc3756968** 0.763052 **abc3756968** abc9493450 1 **abc3756968** abc9483504 1 abc3756968 abc9389034 0.775731 abc3756968 abc2236381 0.775731 abc3756968 abc2236382 0.775731 abc3756968 abc9399043 0.994849 abc3756968 abc9321374 0.764408 abc3756968 abc9399044 0.775731 abc3756968 abc7452703 1 abc3756968 abc4599669 0.775731 abc6917833 abc9483504 0.817637 abc6920271 abc9483504 0.984551 abc4275081 abc9483504 0.834717 abc2209154 abc9483504 0.8642 abc10457594 abc9483504 0.763052 abc3756968 abc9483504 1 abc9493450 abc9483504 1 abc9483504 abc9389034 0.775731 abc9483504 abc2236381 0.775731 abc9483504 abc2236382 0.775731 abc9483504 abc9399043 0.994849 abc9483504 abc9321374 0.764408 abc9483504 abc9399044 0.775731 abc9483504 abc7452703 1 </code></pre> 现在我想重新排序我的文件，这样file1<code>abc9483504</code>中的id将被重新排序为单列。在第一栏或第二栏之前 <pre><code>abc3756968 abc6917833 0.817637 abc3756968 abc6920271 0.984551 abc3756968 abc4275081 0.834717 abc3756968 abc2209154 0.8642 abc3756968 abc10457594 0.763052 abc3756968 abc9493450 1 abc3756968 abc9483504 1 abc3756968 abc9389034 0.775731 abc3756968 abc2236381 0.775731 abc3756968 abc2236382 0.775731 abc3756968 abc9399043 0.994849 abc3756968 abc9321374 0.764408 abc3756968 abc9399044 0.775731 abc3756968 abc7452703 1 abc3756968 abc4599669 0.775731 abc3756968 abc9483504 1 abc9483504 abc3756968 1 abc9483504 abc6917833 0.817637 abc9483504 abc6920271 0.984551 abc9483504 abc4275081 0.834717 abc9483504 abc2209154 0.8642 abc9483504 abc10457594 0.763052 abc9483504 abc3756968 1 abc9483504 abc9493450 1 abc9483504 abc9389034 0.775731 abc9483504 abc2236381 0.775731 abc9483504 abc2236382 0.775731 abc9483504 abc9399043 0.994849 abc9483504 abc9321374 0.764408 abc9483504 abc9399044 0.775731 abc9483504 abc7452703 1 </code></pre> 我写了一个程序，但我知道它需要很多时间来搜索每个ID和重新排序，如果我说100000个ID搜索。我的程序是 <pre><code>rs_dict={} with open("file1") as rs: for line in rs: rs_dict[line.strip()]=1 for rs in rs_dict.keys(): with open("file2") as ld: for line in ld: if rs in line.strip().split(): if rs==line.strip().split()[0]: print line.strip() else: print line.strip().split()[1]+"\t"+line.strip().split()[0]+"\t"+line.strip().split()[2] </code></pre> 我想知道一个更聪明的方法，比如使用熊猫等。我是一个生物学家，想成为一个像样的程序员。你知道吗

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

在python中比较两个文件并重新排序列

1 个回答

相关Python问题