正在获取XKCD映像的src链接?

2024-09-29 19:30:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试从中获取主图像的src(URL)链接xkcd.com网站网站。我使用下面的代码,但它返回类似session="2f69dd2e-b377-4d1f-9779-16dad1965b81", element="{ca4e825a-88d4-48d3-a564-783f9f976c6b}"

from selenium import webdriver
from selenium.webdriver.common.keys import Keys

browser = webdriver.Firefox()

browser.get('http://xkcd.com')
assert 'xkcd' in browser.title

idlink= browser.find_element_by_id("comic")

#link = idlink.get_attribute("src") ## print link prints null

print idlink

使用xpath方法也会返回与上面相同的结果。你知道吗


Tags: from图像importbrowsersrccomget网站
2条回答

browser.find_element_by_id返回web元素,这就是您打印的内容。 此外,所需的文本位于idlink的子元素中。试试看

idlink = browser.find_element_by_css_selector("#comic > img")
print idlink.get_attribute("src")

idlink现在是带有img标记的web元素,其父元素具有comicID。 URL在src中,因此我们需要该属性。你知道吗

以答案为基础here

你需要:

  1. 选择img标签(您当前正在选择div)
  2. 获取img标记的source属性的内容

    img_tag = browser.find_element_by_xpath("//div[@id='comic']/img")
    print img_tag.get_attribute("src")
    

上面应该打印图片的URL

更多使用selenium的python绑定定位元素的技术可以使用here

有关在Selenium中使用XPath的更多信息,请参见this tutorial

相关问题 更多 >

    热门问题