如何在Selenium/Python中将正则表达式应用于xpath?

2024-09-30 18:14:56 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个非常非结构化的HTML文档,最好的清理方法(文本和链接-在附加的img上选择)是regex。那么,是否有可能在Selenium中将这个正则表达式应用于Xpath

pattern = re.compile(r'(?i).*(zobacz|czytaj|przeczytaj).+<a.+a>\B')

有效的方法是:

//text()[contains(., 'Zobacz także')]/../a

但我不确定这是否是最佳解决方案,需要很多条件

enter image description here


Tags: 方法文档文本reimg链接htmlselenium