2024-10-02 22:37:54 发布
网友
当前正在使用liburli来解析和美化数据。但是,我遇到了一个问题,这个网站在页面呈现后使用javascript加载图像(我正在尝试为页面上的某个图像查找图像源)。在
我认为Twill可能是一个解决方案,并尝试打开页面并使用带有“find”的正则表达式返回我要查找的html字符串。不过,我在实现这一点上遇到了一些困难,而且似乎找不到任何关于如何在Twill中使用正则表达式的文档或示例。在
任何帮助或建议如何做到这一点或解决这个问题将不胜感激。在
Twill不能使用javascript(请参见http://twill.idyll.org/browsing.html)
如果要处理javascript,请使用webdriver
我宁愿在页面源代码上使用CSS选择器或“真正的”regexp。斜纹布很难被加工。你有没有试过用CSS选择器的BS或PyQuery?在
Twill不能使用javascript(请参见http://twill.idyll.org/browsing.html)
如果要处理javascript,请使用webdriver
我宁愿在页面源代码上使用CSS选择器或“真正的”regexp。斜纹布很难被加工。你有没有试过用CSS选择器的BS或PyQuery?在
相关问题 更多 >
编程相关推荐