2024-04-18 22:07:26 发布
网友
我有一个导出的csv数据集,它允许来自用户的html文本,我需要将其转换为数据帧
可能带有额外逗号的列用"引起来,但解析器使用其中的逗号作为分隔符
"
这是我正在使用的代码,我已经尝试了来自github issue和another post here的解决方案
pd.read_csv(filePath,sep=',', quotechar='"', error_bad_lines=False)
导致
这是csv文件本身,包含列和第一个条目。
我不知道问题是什么,quotechar应该是有效的,可能是引用字符串中的额外"
quotechar
以下是您遇到的问题:
您将quote(“)设置为quotechar。不幸的是,您的文本中也有quote:
<a href ="....">
所以…在锚定标记之后,接下来的几个逗号不在引号内。你最好的办法可能是用引号(在你的文本中根本不会出现)重新生成原始csv文件
以下是您遇到的问题:
您将quote(“)设置为quotechar。不幸的是,您的文本中也有quote:
所以…在锚定标记之后,接下来的几个逗号不在引号内。你最好的办法可能是用引号(在你的文本中根本不会出现)重新生成原始csv文件
相关问题 更多 >
编程相关推荐