我试图解析一个网站的特定表
在这个网站上,我需要使用xlml和python上的xpath获取列(名称和标题、职业、级别)。在
到目前为止,我有这个代码:
import lxml.html
import requests
from lxml import html
url = "http://www.tibia.com/community/?subtopic=guilds&page=view&GuildName=Black%20Widow"
html = lxml.html.parse(url)
list = html.xpath("//table[@class='TableContent'][1]/tr/td[2]/text()")
假设list
给我第一列“Name and Title”的文本,但是我收到的是一个满是'\xa0'
的列表
我也做了同样的代码vb.net版使用HTML agility pack它运行平稳,我可以在这里发布vb.net版这样你就可以更好地看到我想做什么。在
如果需要从
"Name and Title"
列中获取值,可以在XPath
下面尝试:还要注意,不应该使用
"list"
作为变量名,因为它是Python
内置类的名称相关问题 更多 >
编程相关推荐