python在文件中搜索模式并丢弃重复模式

2024-09-30 14:19:01 发布

您现在位置:Python中文网/ 问答频道 /正文

文件.txt

1349 cyc MNR4____ (00110408:0000004f) 0000e004 00005555
1349 cyc MNR4____ (00110408:0000004f) 0000e004 00005555
1349 cyc MNR4____ (00110408:0000004f) 2002e004 00005555
1349 cyc MNR4____ (00110408:0000004f) 0000e004 00005555
1349 cyc MNR4____ (00110408:0000004f) 0000e004 00005555
1349 cyc MNR4____ (00110408:0000004f) 2002e001 2002e004
1349 cyc MNR4____ (00110408:0000004f) 2002e004 2002e003

需要帮助编写代码来搜索以下内容: 只从第5列转储2002xxxx,不重复

所以上述文件的输出应该是:

2002e004
2002e001 

Tags: 文件代码txtcycmnr4
1条回答
网友
1楼 · 发布于 2024-09-30 14:19:01
with open('file.txt') as infile:
    vals = set()
    for line in csv.reader(infile, delimiter='\t'):
        val = line[-2]
        if val.startswith('2002'):
            vals.add(val)
for val in vals:
    print(val)

相关问题 更多 >