提取XPath的值会产生一些不需要的字符串

2024-09-27 04:21:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在从网页(webscraping)中提取值。我可以成功地得到包含所需值的行,但是,我希望得到值本身。我做得对吗?它真的需要额外的条纹步骤吗

一些来自lxml.html的方法

title = doc.xpath('//*[@class="tytng"]')
print (lh.tostring(title[0]))

网页代码:

<span class="tytng" style="">06MAGNA&nbsp;(06N)</span>

预期结果:

06MAGNA&#160;(06N)

实际结果:

b'<span class="tytng">06MAGNA&#160;(06N)</span>'

Tags: 方法网页doctitlehtml步骤lxmlxpath
1条回答
网友
1楼 · 发布于 2024-09-27 04:21:23

如果我正确理解你的问题,你可以使用“.text”。例如:

title = driver.find_element_by_xpath('//*[@class="tytng"]')
print(title.text)

相关问题 更多 >

    热门问题