regex如何在引号中查找特定单词并保存整个引号?

2024-06-25 23:59:07 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经阅读了一些文档,发现(.*)将查找并存储引号中的任何内容。有没有办法让它只存储包含某个单词的引号?例如,我试图在包含“/pagead/”的html标记中保存报价

<a class="tapItem fs-unmask result job_b6963d28b4e50448 sponsoredJob resultWithShelf sponTapItem desktop" data-ci="374815040" data-empn="3407139265172905" data-hide-spinner="true" data-hiring-event="false" data-jk="b6963d28b4e50448" data-mobtk="1fgcm5quto251800" href="/pagead/clk?mo=r&amp;ad=-6NYlbfkN0C4JTuWysBZGWr3ScYyn1q3GP1

Tags: 文档标记内容datahtml单词fs引号
1条回答
网友
1楼 · 发布于 2024-06-25 23:59:07

您可以使用此正则表达式:

"[^"]*\/pagead\/[^"]*"

第一个和最后一个"取引号之间的值,[^"]*是除"\/pagead\/匹配/pagead/之外的任何字符

/是需要用\转义的特殊字符)

因此,有了这个输入:

<a class="tapItem fs-unmask result job_b6963d28b4e50448 sponsoredJob resultWithShelf sponTapItem desktop" data-ci="374815040" data-empn="3407139265172905" data-hide-spinner="true" data-hiring-event="false" data-jk="b6963d28b4e50448" data-mobtk="1fgcm5quto251800" href="/pagead/clk?mo=r&amp;ad=-6NYlbfkN0C4JTuWysBZGWr3ScYyn1q3GP1"

正则表达式将匹配:

"/pagead/clk?mo=r&amp;ad=-6NYlbfkN0C4JTuWysBZGWr3ScYyn1q3GP1"

相关问题 更多 >