无法检索行

2024-09-28 19:00:53 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用scrapy 0.14

下面是我的密码

start_urls = ['http://lakebagger.com/ur/']

def parse(self, response):
    hxs = HtmlXPathSelector(response)
    stores=hxs.select('//table[@id]//tr')
    print len(stores)

我无法访问tbody中的行(tr),而只能访问thead行。如何访问行?你知道吗

提前谢谢。看起来HtmlXpathSelector无法准确地命名xpath


Tags: selfcomhttp密码parseresponsedefurls
1条回答
网友
1楼 · 发布于 2024-09-28 19:00:53

在这一点上,我想说这是环境问题,尽管不是操作系统的问题,因为我设法得到了一个类似的脚本在Windows7上工作。键入“pip freeze”的结果是什么?你知道吗

我的:

Scrapy==0.16.2
Twisted==12.2.0
distribute==0.6.32
egenix-pyopenssl==0.13.0-1.0.0g-1
lxml==3.0.1
pyOpenSSL==0.9
pywin32==216
w3lib==1.2
zope.interface==3.8.0

另外,我真的认为您应该发布完整的spider代码以供检查,因为在缺少的行中可能有导致问题的内容。你知道吗

编辑:根据您的评论,这可能与运行0.14的版本有关。你考虑过升级吗?你知道吗

注意:我跟随these steps安装了scrapy。你知道吗

相关问题 更多 >