如何正确解析带引号的CSV文件？ - 问答 - Python中文网

如何正确解析带引号的CSV文件？

2024-09-30 02:29:38 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

因此，作为CSV文件的一部分，我尝试使用pd.read\U csv文件（）我不断遇到这个错误：

pandas.errors.ParserError: Error tokenizing data. C error: Expected 3 fields in line 2, saw 4

文件的第一行如下所示：

“雅达”，“雅达”，“雅达”
“雅达”，“雅达”，“aa bb”雅达“cc dd，ee”

问题是在原始二进制内容中，第二行的“yada”没有转义字符。。。你知道吗

我应该在read_csv（）方法中包含哪些参数，以便通过假设整个

“aa bb”yada“cc dd，ee”

是一列吗？你知道吗

Tags：文件 csv pandas read 错误 dd ee aa

1条回答

网友

1楼 · 发布于 2024-09-30 02:29:38

如果引用问题只发生在最后一列中，那么您可以在将数据作为数据帧加载之前按如下方式处理数据：

import pandas as pd      
import csv

data = []

with open('input.csv', newline='') as f_input:
    for row in csv.reader(f_input, quotechar='\x01'):
        data.append([v.strip('"') for v in row[:2] + [','.join(row[2:])]])

df = pd.DataFrame(data)        
print(df)

对于给定的数据，这将为您提供：

      0     1                       2
0  yada  yada                    yada
1  yada  yada  aa bb "yada" cc dd, ee

相关问题更多 >

编程相关推荐

热门问题

热门文章