正则表达式（regex）保存senten的部分内容

2条回答

网友
1楼 · 编辑于 2024-09-29 19:35:10

您可以在模式中使用命名组来捕获子字符串，这使得引用子字符串更容易，而且这样做的代码更可读：
import re data = ['Laura Compton, a Stock Broker from Los Angeles, California', 'Miles Miller, a Soccer Player from Seattle, Washington'] pattern = (r'^(?P<name>[^,]+)\, an? (?P<position>.+) from ' r'(?P<city>[^,]+)\, +(?P<state>.+)') FIELDS = 'name', 'position', 'city', 'state' for sentence in data: matches = re.search(pattern, sentence) name, position, city, state = matches.group(*FIELDS) print(', '.join([name, position, city, state]))
从样本data产生的输出：
Laura Compton, Stock Broker, Los Angeles, California Miles Miller, Soccer Player, Seattle, Washington
A.M.Kuchling写了一篇很好的教程，题为Regular Expression HOWTO你应该退房。你知道吗

网友
2楼 · 编辑于 2024-09-29 19:35:10

你可以试试这个：
import re s = "Laura Compton, a Stock Broker from Los Angeles, California" new_s = re.findall('^[a-zA-Z\s]+|(?<=a\s)[a-zA-Z\s]+(?=from)|(?<=an\s)[a-zA-Z\s]+(?=from)|(?<=from\s)[a-zA-Z\s]+(?=,)|(?<=,\s)[a-zA-Z\s]+$', s) headers = ['name', 'title', 'city', 'state'] data = {a:b for a, b in zip(headers, new_s)}
输出：
{'city': 'Los Angeles', 'state': 'California', 'name': 'Laura Compton', 'title': 'Stock Broker '}

相关问题更多 >

编程相关推荐

热门问题

热门文章