用lxml和xpath进行解析

2024-05-19 14:32:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我试图解析一个网站的特定表

在这个网站上,我需要使用xlml和python上的xpath获取列(名称和标题、职业、级别)。在

到目前为止,我有这个代码:

import lxml.html
import requests
from lxml import html


url = "http://www.tibia.com/community/?subtopic=guilds&page=view&GuildName=Black%20Widow"
html = lxml.html.parse(url)
list = html.xpath("//table[@class='TableContent'][1]/tr/td[2]/text()")

假设list给我第一列“Name and Title”的文本,但是我收到的是一个满是'\xa0'的列表

我也做了同样的代码vb.net版使用HTML agility pack它运行平稳,我可以在这里发布vb.net版这样你就可以更好地看到我想做什么。在


Tags: 代码import名称url标题net网站html
1条回答
网友
1楼 · 发布于 2024-05-19 14:32:36

如果需要从"Name and Title"列中获取值,可以在XPath下面尝试:

//table[@class='TableContent']//td/a/text()

还要注意,不应该使用"list"作为变量名,因为它是Python内置类的名称

相关问题 更多 >