在python中使用匹配关键字搜索并返回文件中的行

1 0001 1 UG science,ee;YEAR=onefour;standard->2;district->9 2 0002 1 UG science,cs;YEAR=onefive;standard->1;district->9 3 0012 2 UG science,eng;YEAR=onefour;standard->3;district->4 4 0021 2 UG science,ee;YEAR=onetwo;standard->2;district->9 5 0056 4 UG science,cs;YEAR=onefive;standard->1;district->8 6 0145 3 UG science,eng;YEAR=onetwo;standard->4;district->2

1 0001 1 UG science,ee;YEAR=onefour;standard->2;district->9 3 0012 2 UG science,eng;YEAR=onefour;standard->3;district->4 2 0002 1 UG science,cs;YEAR=onefive;standard->1;district->9 5 0056 4 UG science,cs;YEAR=onefive;standard->1;district->8 4 0021 2 UG science,ee;YEAR=onetwo;standard->2;district->9 6 0145 3 UG science,eng;YEAR=onetwo;standard->4;district->2

#!/usr/bin/python import re ##open file and read each line of file dfile = open("datafile.txt","r") ##regex to find YEAR in entry and return YEAR regex_unique = re.compile(r'(?<=\bYEAR=)[^;]+') list_Name =[] for line in dfile: match1 = re.search(regex_unique,line) if match1: if match1.group(0) not in list_Name: list_Name.append(match1.group(0)) ## print (list_Name) for item in list_Name: for line in dfile: match2 = re.search(item,line) if match2: print (match2)

1条回答

网友

1楼 · 发布于 2024-10-02 10:28:16

我想我说的对，regex只处理行上的匹配，而不处理如何聚合匹配，所以您需要自己来处理。您可以通过编写自己的实用程序函数并将其与应用程序代码分开来保持简单。在

一般来说，分组操作必须遍历所有项才能组合组。如果不传递所有数据以收集组，然后再传递一次以输出组，则无法解决问题。在

列表字典是一种自然的数据结构，它通过一个键（如您所述）收集每一行。你自己做这件事有点糊涂，因为你经常需要测试一个键是否存在来知道你是应该添加到一个已有的列表中还是创建一个新的。幸运的是，python提供了defaultdict，它允许您：

from collections import defaultdict
>>> d = defaultdict(list)
>>> d[key].append(line)

因此，您可以执行以下操作：

^{2}$

相关问题更多 >

编程相关推荐

热门问题

热门文章