我有一个包含列标题和数据的文本文件。我正在尝试将此文件数据转换为pandas数据帧。在
文件:
#Columns: TargetDoc|GRank|LRank|Priority|Loc ID
aaaaa|1|1|Slow|8gkahinka.01
aaaaa|1|0|Slow|7nlafnjbaflnbja.01
我写了以下代码: 首先,我转换了每一行并尝试转换数据帧:
^{pr2}$但我在测向上出错了:
AssertionError: 5 columns passed, passed data had 10 columns.
我的代码有什么问题,或者有没有更好的方法转换成dataframe?在
这是因为您正在将所有行合并为一个列表:
你想要的是:
^{pr2}$这样,您将得到一个包含5个元素的列表。在
编辑:但强烈推荐使用csv分隔符的上述解决方案。在
您只需使用^{} 和
sep='|'
读入文件,然后使用rename
将第一个列名固定为后处理步骤:现在,^{} 通过传入第一个列名作为传入dict的键和
^{pr2}$split
作为新列名的字符串传入第一列:所以在你的情况下:
然后
rename
如上图所示相关问题 更多 >
编程相关推荐