在Python正则表达式中使用^匹配行首

网友

1楼 · 编辑于 2024-05-17 04:04:53

在这种特殊情况下，不需要使用正则表达式，因为搜索的字符串始终是“PY”，并且应该在行首，因此可以使用string.find来执行此作业。find函数返回在给定字符串或行中找到子字符串的位置，因此如果在字符串的开头找到子字符串，则返回值为0（如果根本没有找到，则返回值为-1），即：

In [12]: 'PY 2015'.find('PY')
Out[12]: 0

In [13]: ' PY 2015'.find('PY')
Out[13]: 1

也许把空白处去掉是个好主意，即：

In [14]: '  PY 2015'.find('PY')
Out[14]: 2

In [15]: '  PY 2015'.strip().find('PY')
Out[15]: 0

下一步，如果对年份感兴趣，则可以使用split提取，即：

In [16]: '  PY 2015'.strip().split()[1]
Out[16]: '2015'

网友

2楼 · 编辑于 2024-05-17 04:04:53

与re.M一起使用re.search：

import re
p = re.compile(r'^PY\s+(\d{4})', re.M)
test_str = "PY123\nPY 2015\nPY 2017"
print(re.findall(p, test_str))

说明：

网友

3楼 · 编辑于 2024-05-17 04:04:53

re.findall(r'^PY (\d\d\d\d)', wosrecords, flags=re.MULTILINE)

应该有用的，如果不行就告诉我。我没有你的数据。