将原始字符串放入正则表达式

2024-09-23 06:30:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试使用正则表达式来查找带有BeautifulSoup的标记。你知道吗

问题是我不知道所有表示regex符号的特殊字符,所以我不知道把/放在哪里。你知道吗

假设在一个div标记中有这个文本:v katalógu rôznych firiem并且网页有字符集-utf-8

result = soup.find('div',text=re.compile('.*'+r'v katalógu rôznych firiem'+'.*'))

如果我尝试print一个result,我会得到None类型,但我肯定有这样的标记。你知道吗

有什么问题吗?regexencoding有问题吗?你知道吗

以下是示例:

<div class="col-sm-10"><h1 class="word-ma">Selsso</h1> —                <b>Zobrazený 1</b> výsledok nájdený                v katalógu rôznych firiem        </div>

Tags: 标记文本div网页符号resulth1class