为什么我运行Spider时会出错?

2024-10-02 14:25:41 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在做一个练习,将特定产品的亚马逊评论放入csv文件中。我已经把我的代码放在一起提取数据,但是当我转到runspider放入csv时,我遇到了一个语法错误。这部分内容是我直接从练习模块中抄来的,所以我不太确定问题出在哪里。我在runspider上找到的所有资源都表明代码应该是正确的,但很明显,我在这里做错了什么

这是我的密码。我在最后一行遇到一个错误:

import scrapy

# Implementing Spider
class ReviewspiderSpider(scrapy.Spider):

    # Name of Spider
    name = 'reviewspider'

    allowed_domains = ["amazon.com"]
    start_urls = ['https://www.amazon.com/product-reviews/B07N49F51N/ref=cm_cr_arp_d_viewpnt_lft?pageNumber=']


    def parse(self, response):
        names = response.xpath('//span[@class="a-profile-name"]/text()').extract()
        reviewTitles = response.xpath('//a[@data-hook="review-title"]/span/text()').extract()
        starRatings = response.xpath('//span[@class="a-icon-alt"]/text()').extract()
        reviews = response.xpath('//span[@data-hook="review-body"]/span/text()').extract()
        noOfComments = response.xpath('//span[@class="a-size-base"]/text()').extract()
        for (name, title, rating, review, comments) in zip(names, reviewTitles, starRatings, reviews, noOfComments):
            yield {'Name': name, 'Title': title, 'Rating': rating, 'Review': review, 'No of Comments': comments }

scrapy runspider spiders/reviewspider.py -t csv -o - > amazonreviews.csv

以下是错误消息:

  File "<ipython-input-35-6e8796e727d9>", line 22
    scrapy runspider <reviewspider.py> -t csv -o - > amazonreviews.csv
                   ^
SyntaxError: invalid syntax

我错过了什么?我对Python、webscraping和scrapy非常陌生,所以任何和所有细分/洞察都是有用的


Tags: csvtextnametitleresponseextractxpathreview
1条回答
网友
1楼 · 发布于 2024-10-02 14:25:41

线路

scrapy runspider spiders/reviewspider.py -t csv -o - > amazonreviews.csv

不是代码的一部分。这只是命令如何运行您的蜘蛛

通过cmd或anaconda提示符转到您的项目位置。试一试

scrapy runspider reviewspider.py -t csv -o amazonreviews.csv

相关问题 更多 >