如何从网页中提取单个元素？

2024-09-28 23:35:08 发布

您现在位置：Python中文网/ 问答频道 /正文

5541

网友

男 | 程序猿一只，喜欢编程写python代码。

我想从下面的网页中提取一个文本值。你知道吗

Cascade River Rustic Campground

具体来说，我是在“网站数量”文本后面加上“4”值（见截图）

我已经能够使用Chrome隔离xpath，如下所示：

//*[@id="act_1"]/div[1]/table/tbody/tr/td[2]

以下代码生成一个空列表：

import urllib2
from lxml import etree

url = "https://www.fs.usda.gov/recarea/superior/recreation/camping-cabins/recarea/?recid=36913&actid=29"

response = urllib2.urlopen(url)
htmlparser = etree.HTMLParser()
tree = etree.parse(response, htmlparser)
x = tree.xpath('//*[@id="act_1"]/div[1]/table/tbody/tr/td[2]')
print x

预期输出应为：

>>> print x
['4']

如何在网页中提取单个元素（即“4”）？你知道吗

Tags：文本 import div id url 网页 table urllib2

1条回答

网友

1楼 · 发布于 2024-09-28 23:35:08

似乎这个xpath适合我（注意没有tbody）并使用text()从节点提取文本：

x = tree.xpath('//*[@id="act_1"]/div[1]/table/tr/td[2]/text()')

print(x[0].strip())
# 4

如何从网页中提取单个元素？

相关问题更多 >

编程相关推荐

热门问题

热门文章

如何从网页中提取单个元素？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >