我试图从this webpage中获取信息。
这是一个screenshot如果网页不工作。
我试图打印第一个<span>
元素中的文本。
我复制了googlechrome中Inspect元素视图提供的XPath(见上面的屏幕截图),并且//*[@id="main"]/div[1]/div/div/div[2]/p[1]/span[1]/text()
被复制到我的剪贴板。
from lxml import html
import requests
# get alert info
page = requests.get( 'https://www.msn.com/en-us/weather/weatheralerts/Beverly%20Hills,California,Unite%20d%20States/we-city?weadegreetype=F&day=1&ocid=ansmsnweather')
tree = html.fromstring(page.content)
alertInfo = tree.xpath( '//*[@id="main"]/div[1]/div/div/div[2]/p[1]/span[1]/text()')
print alertInfo
[]
。我确信URL字符串是正确的。为什么会这样?
我还尝试alertInfo = tree.xpath( '//span/text()')
看看是否可以在列表中选择元素,但即使这样也返回了一个空列表。
谢谢。
相关问题 更多 >
编程相关推荐