多级引号包装csv文件

2024-09-25 10:32:10 发布

您现在位置:Python中文网/ 问答频道 /正文

我的.csv文件如下所示:

col1, col2, col3, col4, col5, col6
"a, """"b, ""string1"""""", ""string2, string3"", """", c,"
"d, """"e, ""string4"""""", ""string5, string6"", """", f,"

我想用熊猫阅读这个文件。如何在一个read_csv命令中处理这三个挑战

  • 撤消单引号“wrap”中的行
  • 撤消四个引号“”中包含逗号的单元格
  • 在包含逗号的相应单元格中,是否将逗号视为字符串

Tags: 文件csvcol2col3col1逗号string1col4
1条回答
网友
1楼 · 发布于 2024-09-25 10:32:10

您可以使用str.replace,只需在双引号下加一个空str

>>> x = '"d, """"e, ""string4"""""", ""string5, string6""'
>>> x
'"d, """"e, ""string4"""""", ""string5, string6""'
>>> x.replace('"', '')
'd, e, string4, string5, string6'

要修复csv文件

name = 'xxx.csv'

with open(name) as f:
    csv = f.read()
with open(name, 'w') as f:
    f.write(csv.replace('"', ''))

相关问题 更多 >