Pandas:用UCS2 LE编码读取csv文件

2024-05-22 00:59:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我想导入10K csv文件生成的第三方应用程序与UCS-2LE编码。我不想像示例Python UTF-16那样使用csv阅读器,因为文件太多了。在

下面你可以找到我的代码,我只想读一个。我使用的是python3.4和Pandas 0.18.1

Sample file下载。在

MWE:

import pandas as pd

df = pd.read_csv('1.csv', 
             encoding="mbcs",
             skip_blank_lines=True,
             error_bad_lines=False,
             decimal=',',
             sep='\s+')

我有个错误:

CParserError: Error tokenizing data. C error: EOF inside string starting at line 17


Tags: 文件csvsample代码应用程序示例pandas编码
1条回答
网友
1楼 · 发布于 2024-05-22 00:59:38

实际上,我不知道您的预期输出如何,但我正在阅读您的文件:

df = pd.read_csv('1.csv', encoding="utf-16", skip_blank_lines=True, error_bad_lines=False, decimal=',', sep='\s+', skiprows=5)

获得类似于:

^{pr2}$

基本上我跳过了前5行(与文件的报告相关,这实际上扰乱了文件格式)。希望有帮助。在

相关问题 更多 >