如何在包含列表或其他文件中唯一项的目录中查找文件？

File_1 >Mycoplasma_hypo MAKEIILGIDLGTTNSVVAIIENQKPVVLENPNGKTTTPSVVAFKNNEEIVGDAAKRQ LETNPEAIASIKRLMGTDKTVRANNNNERDYKPEEISAKILAYLKEYAEKKIGHKVTK >Mycoplasma_galli MSNNNGLIIGIDLGTTNSCVSVMEGAQKVVIENPEGKRTTPSVVSYKNGEIIVGDAAKRQ MLTNPNTIVSIKRLMGTSKKVKINDKGVEKELTPEEVSASILSYLKDYAEKKTGQKISR >Mycoplasma_agal MAKEVIIGIDLGTTNSVVSIVDNGSPVVLENLNGKRTTPSVVSFKDGEIIVGDNAKNQ IETNPDTVASIKRLMGTSKTVHVNNNNNKDYKPEEISAMILEHLKKYAEEKIGHKIEK File_2 >Mycoplasma_hypo MAKEIILGIDLGTTNSVVAIIENQKPVVLENPNGKTTTPSVVAFKNNEEIVGDAAKRQ LETNPEAIASIKRLMGTDKTVRANNNNERDYKPEEISAKILAYLKEYAEKKIGHKVTK >Mycoplasma_galli MSNNNGLIIGIDLGTTNSCVSVMEGAQKVVIENPEGKRTTPSVVSYKNGEIIVGDAAKRQ MLTNPNTIVSIKRLMGTSKKVKINDKGVEKELTPEEVSASILSYLKDYAEKKTGQKISR >Mycoplasma_galli MSNNNGLIIGIDLGTTNSCVSVMEGAQKVVISVVSYKNLKDYAEKKHHGEIIVGDAAKRQ MLTNPNTIVSIKRLMGTSKKVKI-NDKGVEKELTPEEVSASILSYLKDYAEKKTGQKISR >Mycoplasma_gen MAKENNVIIGIDLGTTNSVRTTPSVVSFKDGEIIVGDNAKNQVSIVDNGSPVVLENLNGK IETNPDTVASIKRLMGTSKTVHVNNNNNNKDYKPEEISAMILEHLKKYAEEKIGHKIEK

1条回答

网友

1楼 · 发布于 2024-06-25 23:13:46

path = ["File_1.txt","File_2.txt"]

list_all = []
import re
for i in path:
    s=open(i).read()
    list_all = list_all + re.findall(r'(?<=\s)\>\w+',s) #Extracts all words start with '>'

list_uni = list(set(list_all))

f = open('lookup.txt', 'w+')

f.write("\n".join(list_uni))

f.close()

相关问题更多 >

编程相关推荐

热门问题

热门文章