带有regex的提取函数的行为与“正常”regex提取不同？

testInput = pd.DataFrame({'text': ['\nSOMEWORD\n---------- \nFirstline with some text\nSecondline with some text\nThirdline with some text\nSOME STOP WORD\n-------------------\n']}) pattern = r'(?<=\nSOMEWORD\n----------\n)(\w.+?(?=\nSOME STOP WORD))' test = testInput.iloc[0].str.extract(pattern) test

1条回答

网友

1楼 · 发布于 2024-05-19 03:02:07

您可以放弃lookaround并确保匹配换行符，并通过使用re.DOTALL修饰符（您可以将其设置为内联修饰符，(?s)）重新定义.行为：

r'(?s)\nSOMEWORD\n     \n(\w.+?)\nSOME STOP WORD'

参见regex demo

细节

(?s)-一个内联re.DOTALL修饰符，使.匹配任何字符，包括换行字符
\nSOMEWORD\n \n-一个文字子字符串，其中\n与文字LF char匹配
(\w.+?)-group1（这个值将由str.extract返回）：一个单词char后跟1+个字符，尽可能少
\nSOME STOP WORD-一个LF和一个SOME STOP WORD子串

编程相关推荐

java出现编译错误，我不理解
java在gnu-trove库中是否有任何有序映射？
java Servlet应该有映射，但找不到Servlet
java时间和第二期显示1:10，而不是13:10
java Play Framework 1.2.7 Heroku更新崩溃
线程“main”java中的opencsv异常。lang.NoClassDefFoundError:org/apache/commons/lang3/ObjectUtils
selenium在java中隐藏警告消息
java使用ID引用将JSON实体反序列化为POJO
java无法在JRE 8中加载字体
一个线程中的异常/错误会使整个应用程序停止吗？

相关问题更多 >

编程相关推荐

热门问题

热门文章

带有regex的提取函数的行为与“正常”regex提取不同？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >