使用Pandas或CSV模块将每行具有不同列数的CSV导入Pandas数据框的最佳方法是什么。
"H","BBB","D","Ajxxx Dxxxs"
"R","1","QH","DTR"," "," ","spxxt rixxls, raxxxd","1"
使用此代码:
import pandas as pd
data = pd.read_csv("smallsample.txt",header = None)
生成以下错误
Error tokenizing data. C error: Expected 4 fields in line 2, saw 8
在read_csv()中提供列名列表应该可以做到这一点。
例如:名称=['a','b','c','d','e']
https://github.com/pydata/pandas/issues/2981
编辑:如果不想提供列名,请按照尼古拉斯的建议执行
我们甚至可以使用
pd.read_table()
方法来读取csv文件,它将csv文件转换为单个列的DataFrame
类型,这些列可以被“,”读取和拆分可以将列名动态生成为简单计数器(0、1、2等)。
动态生成列名
Missing values将被分配给CSV行没有值的列。
相关问题 更多 >
编程相关推荐