带尾随字符的子串问题

content_higher = content_conclusion[content_conclusion.index("upper quartile"):content_conclusion.index("%.")] content_lower = content_conclusion[content_conclusion.index("lower quartile"):content_conclusion.index("%")]

2条回答

网友

1楼 · 编辑于 2024-10-01 02:20:45

可以使用Python正则表达式来实现这一点

参考：https://docs.python.org/3/howto/regex.html

我想出了下面的解决办法

import re

txt = "partijen waarvan de lower quartile 0,68% bedraagt en de upper quartile 2,06%."
x = re.findall("lower quartile \d,\d\d%", txt)
y = re.findall("upper quartile \d,\d\d%", txt)

print(f'Lower Quartile: {x[0][-5:]}')
print(f'Upper Quartile: {y[0][-5:]}')

### Output
# Lower Quartile: 0,68%
# Upper Quartile: 2,06%

网友

2楼 · 编辑于 2024-10-01 02:20:45

一种选择是在匹配数字后使用以单词边界结尾的模式

\b(?:lower|upper) quartile \d+(?:,\d+)?\b

b防止部分匹配的单词边界
(?:lower|upper) quartile 匹配其中一个备选方案，然后quartile
\d+(?:,\d+)?将1+个数字与可选的小数部分匹配
\b单词边界

见aregex demo或aPython demo

import re
 
pattern = r"\b(?:lower|upper) quartile \d+(?:,\d+)?\b"
s = "(....) partijen waarvan de lower quartile 0,68% bedraagt en de upper quartile 2,06%."
 
print(re.findall(pattern, s))

输出

['lower quartile 0,68', 'upper quartile 2,06']

相关问题更多 >

编程相关推荐

热门问题

热门文章

带尾随字符的子串问题

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >