https://epolicy.companyname.co.in/PRODUCTNAME/UI/PremiumCalculation.aspx?utm_source=rtb&utm_medium=display&utm_campaign=dbmew-Category-pros&dclid=CO2g3u7Gy98CFUOgaAodUv4E0w
我有数百万这样的网址,我想从中提取两件事
产品名称:前面总是https://epolicy.companyname.co.in
*.aspx:访问的页面
我尝试了以下正则表达式
re.findall('([a-zA-Z]+\.aspx | https://epolicy\.companyname\.co\.in/(.*?)/UI)', URL)
以及它的一些变体。但没用。正确的方法是什么
试试这个
代码:
输出:
Regex似乎根本不适合在这里使用。相反,解析URL,分割路径,并获取第一个和最后一个元素
相关问题 更多 >
编程相关推荐