python 2.7re.多行麻烦

2024-05-19 17:03:01 发布

您现在位置:Python中文网/ 问答频道 /正文

我是python新手,我一直在尝试将php regex更改为python,但是我在这个多行代码方面遇到了一些问题。过去几天我在网上上下打转,我好像搞不懂,如果有人能帮忙那就太好了。以下是我制作的正则表达式:

mlsTagRegex = re.compile("<td\swidth=\"13%\"\sclass=\"TopHeader\">(.*?)</td>", re.MULTILINE)
tdTags = mlsTagRegex.findall(output.getvalue())
print tdTags

下面是我希望它找到的HTML:

^{pr2}$

它只给我一个空数组。我很确定我所缺少的可能是相当简单的,但是就像我说的,我是python新手,如果有人能帮忙的话?谢谢!在

注:findall中的输出是pycurl输出的内容,html的这一部分就在那里。在


Tags: 代码reoutputregextdmultilinephpcompile
2条回答

使用雷多尔,因此“.”字符将匹配任何字符,包括换行符。在

您需要使用^{}使.匹配换行符:

mlsTagRegex = re.compile(r'<td width="13%" class="TopHeader">(.*?)</td>', re.DOTALL)

但实际上您应该避免使用regex来解析html,而是使用BeautifulSoup或{a3}。在

相关问题 更多 >