项目未到达管道

import scrapy import sys import os from tutorial.items import TutorialItem from pprint import pprint class DmozSpider(scrapy.Spider): name = "myspider" allowed_domains = ["www.xyz.co.id"] start_urls = ["http://www.xyz.co.id/search?q=abc"] def parse(self, response): var = response.xpath("//a[@class='img']/@href").extract()[0] item = TutorialItem() item['title'] = var yield item

import csv class TutorialPipeline(object): def __init__(self): self.csvwriter = csv.writer(open('items.csv', 'wb')) def process_item(self, domain, item): print item['title'] self.csvwriter.writerow([item['title']]) return item

2条回答

网友

1楼 · 编辑于 2024-10-05 11:03:52

管道方法process_item()的定义不正确。错误在指定的参数self, domain, item中。documentation中的官方描述是：

process_item(self, item, spider)

将类TutorialPipeline中的方法相应地更改为：

def process_item(self, item, spider):
    print item['title']
    self.csvwriter.writerow([item['title']])
    return item

网友

2楼 · 编辑于 2024-10-05 11:03:52

试试看项目.get（'title'）而不是项['title']

相关问题更多 >

编程相关推荐

热门问题

热门文章