我正在尝试编写一个正则表达式来提取meta标记和与号之间的所有文本
对于下面的示例,我想提取键'我的标签,也就是“这就是想要拉的东西”。问题是我不知道如何让它在和号之前把所有的东西都拉出来。在
$ import re
$ line = 'sometextsometext&My.Tag=This-iswhatIwanttopull&sometextsometext'
$ my_text = re.search('(?<=My\.Tag=)\w+',line)
$ print my_text.group()
$ This
Tags:
您可以使用匹配任何除了和号的正则表达式:
regex[^&;]*匹配零个或多个不是和号的字符。在
问题是
\w
与连字符(-
)不匹配,因此需要将其包含在character class中。在另一个选项是,使用一个反的
^{pr2}$[^ ]
字符类,表示除&
之外的任何字符注意:使用
r
是Python用于正则表达式模式的原始字符串表示法,以避免转义。在相关问题 更多 >
编程相关推荐