Python正则表达式使用re.findall（r'（）'，string）选择性地选择数字

'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor?::enim', '9. Ut enim ad minima veniam, quis nostrum exercitationem.2', '. . . . . 9.1 dolore magnam aliquam quaerat', '. . . . . 9.1 ed quia consequuntur magni.1', '. . . . . 9.2 Quis autem vel eum iure reprehenderit.2'

'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor?::enim', 'Ut enim ad minima veniam, quis nostrum exercitationem.2', 'dolore magnam aliquam quaerat', 'ed quia consequuntur magni.1', 'Quis autem vel eum iure reprehenderit.2'

3条回答

网友

1楼 · 编辑于 2024-06-26 18:06:57

尝试使用更复杂的正则表达式，例如：

import re

expression = re.compile(r'(.*?[0-9].+? )*(.+)')

# this is a list of tuples, and you are always interested in the last match
results = expression.findall('<string>')[-1][-1]

网友

2楼 · 编辑于 2024-06-26 18:06:57

可以转换与正则表达式匹配的子字符串（设置大小写无关标志）

(?<=^')[^a-z]+

清空字符串

Demo

正则表达式的内容是，“匹配一个或多个字符，而不是在行首单引号后面的字母”(?<=^')是一个正向查找

网友

3楼 · 编辑于 2024-06-26 18:06:57

也许

import re

text = """
'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor?::enim',
'9. Ut enim ad minima veniam, quis nostrum exercitationem.2',
'. . . . . 9.1 dolore magnam aliquam quaerat',
'. . . . . 9.1 ed quia consequuntur magni.1',
'. . . . . 9.2 Quis autem vel eum iure reprehenderit.2'
"""

pattern = re.compile(r".*?(\d\.\d? )")

print(pattern.sub(r"'", text))

产出：

'Lorem ipsum dolor sit amet, consectetur adipiscing elit, sed do eiusmod tempor?::enim',
'Ut enim ad minima veniam, quis nostrum exercitationem.2',
'dolore magnam aliquam quaerat',
'ed quia consequuntur magni.1',
'Quis autem vel eum iure reprehenderit.2'

相关问题更多 >

编程相关推荐

热门问题

热门文章