我试图提取特殊字符>
和单词模式.myword
之间的所有字符(通常是多个单词,包括空格)。在我的数据帧中。你知道吗
我尝试了以下方法,只在.myword
中添加了一个单词:
df['my_column'] = df['text'].str.findall(r'(\w+.myword)')
一些字符串示例:
str1 = 123abc >I want this1.myword #extract I want this1.myword
str2 = 123<>I want this2.myword<> #extract I want this2.myword
(?<=)
正面回顾[^]
负字符集首先,一个简单的点
.
匹配任何字符,因此您希望在regex中转义它:\.
否则,regex还会在例如:中找到匹配项
123>Iwantthis!myword # extracts Iwantthis!myword
其次,必须允许捕获的组中有空格字符:
\s
。你知道吗我想这应该适合你:
r'([\w\s]+\.myword)'
我不使用regex,而是定义一个特定的函数来提取子字符串:
代码
相关问题 更多 >
编程相关推荐