擅长:python、mysql、java
<p>您可以解析CSV文件并创建两个数据结构。两本词典。在</p>
<p>一个字典将包含每一行,关键字为<code>PDB ID</code>。另一个字典将存储<code>PDB ID</code>的集合,并键入关键字。在</p>
<p>下面只是示例代码,因为我忽略了头。你可能想正确地解析csv。。。在</p>
<pre><code>from collections import defaultdict
entries = {}
keywords = defaultdict(set)
with open('my_csv.csv') as f:
for line in f:
entries[line.split()[0]] = line # so keying on the PDB ID
with open('my_csv.csv') as f:
for line in f:
for kw in line.split()[1:]
keywords[kw].add(line.split()[0])
</code></pre>
<p>一旦有了这两个数据结构,在关键字dict中查找关键字、遍历集合并用相关的PDB id打印出每一行都应该很简单</p>