如何为网站url模式设置regex

2024-05-19 06:21:29 发布

您现在位置:Python中文网/ 问答频道 /正文

url模式是

http://www.hepsiburada.com/philips-40pfk5500-40-102-ekran-full-hd-200-hz-uydu-alicili-cift-cekirdek-smart-android-led-tv-p-EVPHI40PFK5500

这个网站有相似的网址。此url的唯一标识符是-p-。 url模式在url末尾的单词前面总是有-p-。在

我使用了以下正则表达式

^{pr2}$

它匹配,但它匹配这个网站上的许多模式。在

例如,regex应该与上面的url匹配,但不应该与

http://www.hepsiburada.com/bilgisayarlar-c-2147483646

Tags: comhttpurl网站www模式fullhd
1条回答
网友
1楼 · 发布于 2024-05-19 06:21:29

由于您使用的是re.match,因此您确实需要从一开始就匹配字符串。但是,主要问题是您的-p-位于字符类中,因此被视为可以匹配的单独符号。与\w+相同,它分别被视为\w和{}。在

所以,使用序列

 (.*)hepsiburada\.com/([\w.-]+)(-p-\w+)$

this regex demo

或者

^{pr2}$

参见regex demo

请注意,您甚至不需要在捕获组中使用,并且可以从模式中删除(...)括号。在

相关问题 更多 >

    热门问题