Python中文
首页
教程
问答
标签
搜索
登录
注册
Scrapy KeyError:'项目不支持字段:url'
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>我在学做蜘蛛,一直在想办法找出这个小虫子。任何帮助都将不胜感激。谢谢。在</p> <p>当我运行我的蜘蛛时,我收到这样一个错误:</p> <blockquote> <p>KeyError: 'SoapguildItem does not support field: url'</p> </blockquote> <p>以下是我一直在研究的代码:</p> <pre><code># -*- coding: utf-8 -*- import scrapy from scrapy.linkextractors import LinkExtractor from scrapy.spiders import CrawlSpider, Rule from soapguild.items import SoapguildItem class SoapySpider(CrawlSpider): name = 'soapy' allowed_domains = ['soapguild.org'] start_urls = ['http://www.soapguild.org/'] rules = ( Rule(LinkExtractor(), callback='parse_item', follow=True), ) def parse_item(self, response): href = SoapguildItem() href['url'] = response.url # Email email = response.xpath("//div/div[1]/p[2]/a[1]/@href").extract() email = email.replace("mailto:", "") #email = email.replace("(at)". "@") location = response.xpath("//div/div[1]/p[1]/text()[2]").extract() #location location = response.xpath("//div/div[1]/p[1]/text()[2]").extract() #contact contact = response.xpath("//div/div[1]/p[2]/text()[1]").extract() contact = contact.replace("Contact: ", "") #website website = response.xpath("//div/div[1]/p[2]/a[2]//@href").extract() for item in zip(email,location,contact,website): scraped_info = { 'Email' : item[0], 'Location' : item[1], 'Contact' : item[2], 'Website' : item[3] } yield scraped_info </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>你在中添加了url作为字段吗items.py?我认为错误来自于:href['url']</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何添加虚拟方法
2 回答
如何添加表示整数的擦边字符串?
6 回答
如何添加要在Bokeh中使用的新font.ttf文件?
1 回答
如何添加要显示的矩阵XY轴编号和XY轴
8 回答
如何添加计数?
8 回答
如何添加计数器函数?
8 回答
如何添加计数器列来计算数据帧中另一列中的特定值?
2 回答
如何添加计数器来跟踪while循环中的月份和年份?
2 回答
如何添加计数并删除countplot的顶部和右侧脊椎?
9 回答
如何添加计时器wx.应用程序更新窗口对象的主循环?
4 回答
如何添加评论到帖子?PostDetailVew,Django 2.1.5
3 回答
如何添加评论拉梅尔亚姆
8 回答
如何添加诸如矩阵Python/Pandas之类的数据帧?
7 回答
如何添加谷歌地点自动完成到Flask?
3 回答
如何添加超时、python discord bot
3 回答
如何添加超过1dp的检查
5 回答
如何添加距离方法
6 回答
如何添加跟随游戏的敌人精灵
7 回答
如何添加路径以便python可以找到程序?
10 回答
如何添加身份验证/安全性以使用happybase访问HBase?
8 回答