无法使用pandas read\u csv正确读取引号

2024-10-02 06:21:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个文件test.tsv,其中一些行带有引号,它基本上跳过了使用新行字符作为新行指示符的停止。如果我有文件

" m     1
what does comoda mean   1
the poke co     1
dmf     1
"g      1

我用

test = pd.read_csv("test.tsv", 
                  sep='\t')

我把所有的行作为一行

 m\t1\nwhat does comoda mean\t1\nthe poke co\t1\ndmf\t1\ng  1

我希望保持所有行的完整性并获得输出

" m     1
what does comoda mean   1
the poke co     1
dmf     1
"g      1

有没有办法解决这个双重报价问题?我有多行出来作为一个单一的行,无论我有双引号打开,直到有双引号关闭。然后正确解释行


Tags: 文件thetesttsvmean字符what引号
1条回答
网友
1楼 · 发布于 2024-10-02 06:21:36

您可以使用^{}quoting关键字参数来控制引号的解析。在您的情况下,您可以像这样禁用报价:

>>> import pandas as pd
>>> import csv

>>> pd.read_csv("test.tsv", sep='\t', quoting=csv.QUOTE_NONE)                 

                     " m  1
0  what does comoda mean  1
1            the poke co  1
2                    dmf  1
3                     "g  1

请注意,第一行被解释为列标题。传递header=None以防止发生这种情况

相关问题 更多 >

    热门问题