所以,我已经按照评论中的要求总结了我的问题(对不起,我也开始使用stackoverflow)
这就是我的问题。如果你浏览this link to vinted.fr,你会看到很多公告。但如果您使用scrapy浏览此网站,例如使用以下命令:
scrapy shell https://www.vinted.fr/vetements?search_text=
view(response)
你不会看到广播
我认为这是由于用户代理造成的,所以我在我的settings.py中设置了以下代码:
USER_AGENT = 'Mozilla/5.0 (X11; Linux x86_64) '
但它什么也没做。你有什么解决办法吗?或者任何有助于阅读的文档
实际上,公告是HTML格式的,很容易抓取
您可以使用regex查找每个产品
json
,然后提取所需内容您可以查看项目Vinted-data。我正在使用它从Vinted.fr中提取数据
Scrapy
并不总是好的解决方案,你必须用regex
或其他方法弄脏你的手相关问题 更多 >
编程相关推荐