在python中查找列表和字典之间的公共元素

f1=open('mydict.txt','r') f2=open('mylist.txt','r') output = open('result.txt','w') dictA= dict() for line1 in f1: listA = line1.rstrip('\r\n').split('\t') dictA[listA[1]] = listA[0] for line1 in f2: new_list=line1.rstrip('\n').split() query=new_list[0] if query in dictA: listA[0] = dictA[query] output.write(query+'\t'+str(listA[0])+'\n')

2条回答

网友

1楼 · 编辑于 2024-09-30 12:28:54

在第一个for循环中，将txt文件转换为python字典时，将丢失信息：

for ...:
    dictA[listA[1]] = listA[0]

例如，如果你有线条

^{pr2}$

在您的txt文件中，生成的字典将只有最后一个条目的键值对，颠倒。在

为了实现您的目标，只需对程序进行最少的修改，请尝试

from collections import defaultdict

f1=open('mydict.txt','r')
f2=open('mylist.txt','r')
output = open('result.txt','w')
dictA= defaultdict(list)

for line1 in f1:
    listA = line1.rstrip('\r\n').split('\t')
    dictA[listA[1]].append(listA[0])  # Save all the common proteins

for line1 in f2:
    new_list=line1.rstrip('\n').split()
    query=new_list[0]
    if query in dictA:
        listA = dictA[query]  # Now have a list of matching contigs
        for contig in listA:
            output.write(contig + '\t' + query +'\n')

网友

2楼 · 编辑于 2024-09-30 12:28:54

你这样做是不对的。如果你把“字典文件”存储在字典结构中，使用蛋白质名称作为键，你将丢失信息。在

一个更好的方法是首先阅读蛋白质列表，然后将所有蛋白质名称存储在一个集合中。然后，阅读字典文件并打印所有蛋白质名称在集合中的行。在

with open('mylist.txt') as mylist:
    proteins = set(line.strip() for line in mylist)

with open('mydict.txt') as mydict, open('result.txt', 'w') as output:
    for line in mydict:
        _, protein = line.strip().split()
        if protein in proteins:
            output.write(line)

相关问题更多 >

编程相关推荐

热门问题

热门文章