我正在用Python做网页抓取。我需要获得所有搜索结果页面的链接。但是,我发现href值不是一个常规的html链接,而是如下所示的内容。如何获得正确的页面链接?谢谢
<a href="javascript:showDocumentSearchResult('20','20','en','','0', '10','srt', 'docdt', 'desc');">2</a>
<a href="javascript:showDocumentSearchResult('20','40','en','','0', '10','srt', 'docdt', 'desc');">3</a>
您需要在JS代码中找到
showDocumentSearchResult
函数(不过它可能在单独的文件中)。然后了解该函数的作用,如果可能的话,您可以用Python模拟这样的操作请参见以下示例:https://webscraping.pro/download-a-file-from-a-link-in-python/
相关问题 更多 >
编程相关推荐