使用OR操作的Python正则表达式

import re def series2string(myserie) : myserie2 = ' or '.join(serie for serie in myserie) return myserie2 def expression(pattern, mystring) : x = re.findall(pattern, mystring) if len(x)>0: return 1 else: return 0 #text example text = "\n\n (troisième chambre)\n i - vu la requête, enregistrée le 28 février 1997 sous le n° 97nc00465, présentée pour m. z... farinez, demeurant ... à dommartin-aux-bois (vosges), par me y..., avocat ;\n" #expressions to look out pattern1 = '^\s*vu.*\n' pattern2 = '^\s*\(\w*\s*\w*\)\s*.*?vu.*\n' pattern = [pattern1, pattern2] pattern = series2string(pattern) expression(pattern, text)

2条回答

网友
1楼 · 编辑于 2024-09-30 03:23:55

谢谢你的建议。在我的第一篇文章中，我的正则表达式有点笨拙（我改变了它们，希望问题更容易理解）。由于“re.compile”，我成功地捕获了或运算符“|”，代码运行良好！在
import re def series2string(myserie) : myserie2 = '|'.join(serie for serie in myserie) return myserie2 def expression(pattern, mystring) : x = re.findall(pattern, mystring) if len(x)>0: return 1 else: return 0 #text example text = "\n\n (troisième chambre)\n i - vu la requête, enregistrée le 28 février 1997 sous le n° 97nc00465, présentée pour m. z... farinez, demeurant ... à dommartin-aux-bois (vosges), par me y..., avocat ;\n" #expressions to look out pattern1 = r'^\s*vu.*\n' pattern2 = r'^\s*\(\w*\s*\w*\)\s*.*?vu.*\n' pattern = [pattern1, pattern2] pattern = series2string(pattern) expression(re.compile(pattern), text)

网友
2楼 · 编辑于 2024-09-30 03:23:55

Python正则表达式使用|运算符进行交替。在
def series2string(myserie) : myserie2 = '|'.join(serie for serie in myserie) myserie2 = '(' + myserie2 + ')' return myserie2
更多信息：https://docs.python.org/3/library/re.html
个别的模式看起来很混乱，所以我不知道什么是错误，什么是故意的。我猜你是在几个不同的上下文中寻找“vu”这个词。在
对于正则表达式，始终使用Python原始字符串，前缀为r（r'pattern here'）。它允许您在模式中使用\，而无需python尝试将其解释为字符串转义。它直接传递给regex引擎。(ref)
使用\s匹配空白（空格和换行符）。在
因为您已经有了几种可选模式，所以不要将(和{}设为可选。它会导致灾难性的回溯，这会使匹配大字符串的速度非常慢。
\(?→{}
\)?→{}
{1}什么都不做。它只重复上一个子模式一次，这与不指定任何内容相同。在
\br无效。它被解释为\b（ASCII贝尔字符）+字母r。在
文本字符串的开头有一个引号（'）。或者您希望^匹配任何行的开头，或者'是一个复制/粘贴错误。在
组合图案时的一些错误：
pattern = [pattern1, pattern2, pattern3, pattern4] pattern = series2string(pattern) expression(re.compile(pattern), text)

相关问题更多 >

编程相关推荐

热门问题

热门文章