如何正确解析带引号的CSV文件?

2024-09-30 02:29:38 发布

您现在位置:Python中文网/ 问答频道 /正文

因此,作为CSV文件的一部分,我尝试使用pd.read\U csv文件()我不断遇到这个错误:

pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 2, saw 4

文件的第一行如下所示:

  1. “雅达”,“雅达”,“雅达”
  2. “雅达”,“雅达”,“aa bb”雅达“cc dd,ee”

问题是在原始二进制内容中,第二行的“yada”没有转义字符。。。你知道吗

我应该在read_csv()方法中包含哪些参数,以便通过假设整个

“aa bb”yada“cc dd,ee”

是一列吗?你知道吗


Tags: 文件csvpandasread错误ddeeaa
1条回答
网友
1楼 · 发布于 2024-09-30 02:29:38

如果引用问题只发生在最后一列中,那么您可以在将数据作为数据帧加载之前按如下方式处理数据:

import pandas as pd      
import csv

data = []

with open('input.csv', newline='') as f_input:
    for row in csv.reader(f_input, quotechar='\x01'):
        data.append([v.strip('"') for v in row[:2] + [','.join(row[2:])]])

df = pd.DataFrame(data)        
print(df)

对于给定的数据,这将为您提供:

      0     1                       2
0  yada  yada                    yada
1  yada  yada  aa bb "yada" cc dd, ee

相关问题 更多 >

    热门问题