擅长:python、mysql、java
<p>似乎对于较低的文件(我假设它是第二种格式),您唯一关心的字段是“ocasstart”。因为,根据您的描述,您不一定关心其他数据,所以您可以创建一组所有的ocasstart:</p>
<pre><code>locusStart_list = set()
with open(upper_file, 'r') as f:
for line in f:
tmp_list = line.strip().split()
locusStart_list.add(tmp_list[1])
</code></pre>
<p>这将删除对底部文件所做的所有不必要的行操作。然后,您可以轻松地将字段的ocassstart与从下面的文件构建的集进行比较。集合还可以删除重复项,使其比使用列表快一点。在</p>