我正在尝试从this网站上删除图像。我试过用Scrapy(使用Docker)和Scrapy/slenium。Scrapy在windows10 home中似乎不起作用,所以我现在尝试使用Selenium/Beautifulsoup。我用Python3.6和Spider进入一个Python环境。在
我需要的href元素如下所示:
<a class="emblem" href="detail/emblem/av1615001">
我有大问题:
-如何使用beauthoulsoup选择href?在下面我的代码中,您可以看到我尝试了什么(但没有成功)
-由于可以观察到href只是指向url的部分路径…我应该如何处理此问题?在
这里是我目前为止的代码:
^{pr2}$
不确定以上答案是否起作用。这是一个为我做工作的。在
您可以通过类名获取href:
问题1:
试试这个。它将给你所有的网址遍历所有网页在该网站。我使用了
Explicit Wait
使它更快、更动态。在部分输出:
^{pr2}$相关问题 更多 >
编程相关推荐