我想知道如何忽略没有填充所有字段的项,某种类型的删除,因为在scrapyd的输出中,我得到的页面没有填充所有字段。在
我有密码:
class Product(scrapy.Item):
source_url = scrapy.Field(
output_processor = TakeFirst()
)
name = scrapy.Field(
input_processor = MapCompose(remove_entities),
output_processor = TakeFirst()
)
initial_price = scrapy.Field(
input_processor = MapCompose(remove_entities, clear_price),
output_processor = TakeFirst()
)
main_image_url = scrapy.Field(
output_processor = TakeFirst()
)
分析器:
^{pr2}$我想用Loader来做,而不需要用我自己的选择器创建(以避免处理项目两次)。我想我可以将它们放入管道中,但可能不是最好的方法,因为这些项无效。在
数据验证是管道的典型用例之一。在您的例子中,您只需要编写少量代码来检查所需字段,大致如下:
您需要在中启用管道设置.pyRead more in scrapy docs。在
相关问题 更多 >
编程相关推荐