我用pythonscrapy编写了一个脚本,用于解析yellowpage中的一些项目。当我执行脚本时,它确实完美地解析了所有项。然而,每当我将这些刮取的数据写入一个csv文件时,我会遇到一些问题,当我打开csv文件并填充数据时,我看到数据每隔一行打印一次。我怎样才能去掉空白行?我将脚本信息粘贴在下面,供您参考。在
““项目.py“包括:
from scrapy.item import Item, Field
class RealypItem(Item):
Name = Field()
Address = Field()
Phone = Field()
““yp.py公司“又名蜘蛛包含:
^{pr2}$我用来运行脚本的命令:
scrapy crawl YellowPage -o items.csv -t csv
以下是csv文件中填充的数据的部分图片:
一切似乎都没问题,只是无论你用什么软件来显示你的csv都会被你的Windows换行符搞混了。在
通常换行符是
\n
,而在Windows上是\n\r
。有操作系统意识的Scrapy添加了Windows新行,而不是普通的。你的csv程序需要通用的换行符,但却得到了Windows的换行符。在这里最简单的解决方法是手动删除文件中的
\r
个字符。在相关问题 更多 >
编程相关推荐