我写了下面这样的网站地图:
class filmnetmapSpider(SitemapSpider):
name = "filmnetmapSpider"
sitemap_urls = ['http://filmnet.ir/sitemap.xml']
sitemap_rules = [
('/series/', 'parse_item')
]
def parse_item(self, response):
videoid = response.xpath('/loc/text()').extract()
并从中提取所有url
我想写另一个scrapy spider,它的start_url是上一个spider(sitemapSpider)的输出
我该怎么做??在
假设您从第一个spider获得csv格式的输出,下面的代码将逐行读取该文件,并使用xpath将其擦除。在
希望有帮助。在
您需要某种数据库或文件来存储一个spider的结果并在另一个spider中读取它们。在
相关问题 更多 >
编程相关推荐