每次重新运行时,将碎片导出为csv而不使用标题

2024-06-26 13:24:43 发布

您现在位置:Python中文网/ 问答频道 /正文

这是我的密码:

items.py

from scrapy import Item, Field
class NetmallScrapyItem(Item):
    # define the fields for your item here like:
    phoneNum = Field()
    workTime = Field()

spider.py

from scrapy import Spider
from scrapy.selector import Selector
from Netmall_Scrapy.items import NetmallScrapyItem

class FukuikitaSpider(Spider):
    name = 'FukuiKita'
    allowed_domains = ['netmall.hardoff.co.jp/shop/201087']
    start_urls = ['http://netmall.hardoff.co.jp/shop/201087/']

    def parse(self, response):
        item = NetmallScrapyItem()
        item['phoneNum'] = response.xpath(".//span[@class='u-pc']/text()").extract_first()
        item['workTime'] = response.xpath(".//div[@class='p-dispShop__contact']/p[2]/text()").extract_first()
        return item

我的输出文件

phoneNum,workTime
電話 0776-57-0077,営業時間 10:00~20:00
phoneNum,workTime
電話 0776-57-0077,営業時間 10:00~20:00

因此,请帮助我使我的输出csv如下所示:

phoneNum,workTime
電話 0776-57-0077,営業時間 10:00~20:00
電話 0776-57-0077,営業時間 10:00~20:00

顺便说一句,你们能告诉我存储数据的最佳方法吗。多谢各位


Tags: frompyimportfieldresponseitemsitemclass