Pandas read_csv不忽略带引号字符串中的逗号

2024-04-18 22:07:26 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个导出的csv数据集,它允许来自用户的html文本,我需要将其转换为数据帧

可能带有额外逗号的列用"引起来,但解析器使用其中的逗号作为分隔符

这是我正在使用的代码,我已经尝试了来自github issueanother post here的解决方案

pd.read_csv(filePath,sep=',', quotechar='"', error_bad_lines=False)

导致

Result

这是csv文件本身,包含列和第一个条目。 csvFile

我不知道问题是什么,quotechar应该是有效的,可能是引用字符串中的额外"


1条回答
网友
1楼 · 发布于 2024-04-18 22:07:26

以下是您遇到的问题:

您将quote(“)设置为quotechar。不幸的是,您的文本中也有quote:

<a href ="....">

所以…在锚定标记之后,接下来的几个逗号不在引号内。你最好的办法可能是用引号(在你的文本中根本不会出现)重新生成原始csv文件

相关问题 更多 >