解码CSV文件

2024-10-01 22:42:22 发布

您现在位置:Python中文网/ 问答频道 /正文

df=pandas.read_csv(“commasoperated.csv”) 将csv文件导入pandas,但查看pandas.columns时,我得到了此文件格式

enter image description here

使用pandas.head()查看文件头我得到了这个文件输出

enter image description here

现在我的问题是,我有没有办法在没有这些字符的情况下输出一个正确的CSV文件

This is how it looks in notepad++ "003 ""|"" ""|"" ""|""7105926 ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|"" ""|""绿色20年4月24日GH20200071398001DK


Tags: columns文件csvimagepandasdfreadhere
1条回答
网友
1楼 · 发布于 2024-10-01 22:42:22

您的初始文件的csv格式不正确。长话短说,唯一合理的做法是让恐怖片的制作人修改格式。如果不可能,可以使用csv模块尝试通过每行解码一次并输出第一个也是唯一一个字段来修复它:

import csv

with open("commaSeperated.csv") as fdin, open("fixed.csv", newline="\r\n") as fdout:
    rd = csv.reader(fdin, delimiter='|', quotechar='"')
    for row in rd:
        print(row[0], file=fdout)

完成后,您可以尝试将其加载到数据帧中:

df = pd.read_csv("fixed.csv", sep=r"\|")

相关问题 更多 >

    热门问题