Python中文
首页
教程
问答
标签
搜索
登录
注册
如何在item对象中正确存储刮取的数据,并将每组数据保存到一个csv文件中?
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>所以我让我的小蜘蛛工作得很好。我得到了所有的数据。我利用设置items.py来捕获我们想要的7条数据。我可以把数据写进文件里。。但现在的问题是,我需要按照items.py设置的顺序将数据捕获到1个输出文件中。似乎不知道如何创建文件,如果它不存在(网站名和日期,使它成为一个唯一的文件名)</p> <p>这是我目前拥有的,但这会为每个被刮去的页面/url创建一个文件,我想将所有这些整合到我们刮去的每个站点的一个文件中</p> <p>我不喜欢itmDetails2格式化数据的方式,除非这是唯一的方式,但我认为sine the dets[]是我的items.py值列表,我可以简单地将每个集合存储在其中,然后将dets[]写入csv</p> <p>有谁能举出一个很好的例子来说明我要做什么?我找到了一个python/webscraping备忘单,并尝试了保存数据的示例,但没有成功</p> <pre><code>https://blog.hartleybrody.com/web-scraping-cheat-sheet/ itmDetails2 = dets['sku'] +","+ dets['description']+","+ dets['price']+","+ dets['brand']+","+ dets['compurl']+","+ dets['reviewcount']+","+ dets['reviewrating'] filename = 'dsg-%s.txt' % dets['description'] with open(filename, 'w') as f: for its in itmDetails2: f.write(str(its)) </code></pre> <p>这是我的items.py文件,因为我捕获了每个报废循环的全部或大部分日期,我如何将每个集合作为逗号分隔的行写入csv</p> <pre><code>import scrapy class Dsg2Item(scrapy.Item): description = scrapy.Field() sku = scrapy.Field() price = scrapy.Field() brand = scrapy.Field() compurl = scrapy.Field() reviewcount = scrapy.Field() reviewrating = scrapy.Field() </code></pre>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>您可以使用csvwriter,或者在编写文件时使用append模式。 还有用于本地json存储的tinydb</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
无法使用Django/mongoengine连接到MongoDB(身份验证失败)
7 回答
无法使用Django\u mssql\u后端迁移到外部hos
4 回答
无法使用Django&Python3.4连接到MySql
5 回答
无法使用Django+nginx上载媒体文件
9 回答
无法使用Django1.6导入名称模式
10 回答
无法使用Django1.7和mongodb登录管理站点
9 回答
无法使用Djangoadmin创建项目,进程使用了错误的路径,因为我事先安装了错误的Python
6 回答
无法使用Djangockedi验证CBV中的字段
3 回答
无法使用Djangocketditor上载图像(错误400)
3 回答
无法使用Djangocron进行函数调用
8 回答
无法使用Djangofiler djang上载文件
6 回答
无法使用Djangokronos
6 回答
无法使用Djangomssql provid
1 回答
无法使用Djangomssql连接到带有Django 1.11的MS SQL Server 2016
8 回答
无法使用Djangomssq迁移Django数据库
2 回答
无法使用Djangonox创建用户
3 回答
无法使用Djangopyodb从Django查询SQL Server
7 回答
无法使用Djangopython3ldap连接到ldap
8 回答
无法使用Djangoredis连接到redis
1 回答
无法使用Django中的FK创建新表
5 回答