我从一个网站上搜集了数据”itjuzi.com网站,并将嵌套列表存储在csv文件中,并用pandas读取它。但是现在如何像列表一样读取unicode字符串或嵌套列表呢?编码呢?在
代码是“pd.read_csv文件('/root/code/company_信息.csv',编码='utf-8')“
源数据样本
“[[u'\u5b5f\u51e1\u5b87',u'\u521b\u59cb\u4eba',u'\u963f\u72fc\u5de5\u4f5c\u5ba4\u521b\u59cb\u4eba\u517cCEO',u'http://www.itjuzi.com/person/29395']]
所有源数据
unicode数据就在那里,只是没有呈现:
关于你的列表,你需要调整你的蜘蛛代码。默认情况下,scrapy ItemLoaders甚至选择器的
eextract()
方法返回一个值列表,即使其中只有一个值。在要解决这个问题,只需确保值不是列表:
^{pr2}$相关问题 更多 >
编程相关推荐