我关注了以前在stackoverflow上遇到的一些问题,但是没有一个能完全解决我的问题。你知道吗
我正试图在一个硬币拍卖网站上拉屎。我能够动态网页报废的第一页,但不能网页报废的其余网页。你知道吗
我遵循urlHow to scrape multiple pages with an unchanging URL - Python 3中提到的步骤
在TodyWallAuctions上,我们没有上面示例中提到的表单数据。你知道吗
当我们更改页面时,它会访问URLhttps://www.todywallaauctions.com/Results.aspx/getSearchResult,但没有页面索引信息。你知道吗
我应该使用什么URL访问第二个页面?你知道吗
这个页面使用
JavaScript
,它使用urlgetSearchResult
从服务器加载XML
,然后它生成HTML,并在页面上替换它。所以最后你得到了第二个页面,但是这个页面没有自己的URL,也没有完整的HTML。你知道吗您必须创建
POST
到urlgetSearchResult
的请求,并在JSON数据中以'pageTop'
的形式发送页码,类似于它将返回
JSON
数据,其中一个字段"d"
包含XML
所有数据。然后可以使用BeautifulSoup
或lxml
在XML
中搜索数据。你知道吗顺便说一句:带有
XML
的文本有一些带有大写字符的名称,比如ShortDesc
,但是代码需要小写字符shortdesc
结果:
编辑:此代码可以下载图像。你知道吗
相关问题 更多 >
编程相关推荐