标准字符编码Pandas。阅读

2024-10-01 07:11:17 发布

您现在位置:Python中文网/ 问答频道 /正文

read_csv返回此错误: Initializing from file failed使用latin-1utf-8 andISO-8859-1。在

from pandas import *

df = dict(A=[1,2,3],B=['abc','efg','hig'],C=[100,200,300])
df = DataFrame(df)   
df

    A    B    C
0   1   abc  100
1   2   efg  200
2   3   hig  300

我用一个德语字符写了如下:

^{pr2}$

但它无法以这种方式导入:

read_csv('Lück.txt', sep='\t', encoding = 'utf-8')

毕竟,如果有蚂蚁的方法来检测特殊的德语字符,我会取代它。在

另外,我在这期杂志上看到了很多帖子,但是没有一篇文章与我的问题一致,而且我不擅长标准字符解码/编码,谢谢。在


Tags: csvfromdfread错误字符utffile
1条回答
网友
1楼 · 发布于 2024-10-01 07:11:17

很可能根本原因不是德语变音,而是.csv文件中的一个或多个“奇怪”whitespace字符。尤其是当.csv文件被任何类型的copy/paste operation to excel事先修改时。在

首先,开始您的python脚本,如下所示:

#!/usr/bin/env python 
# -*- coding: utf-8 -*

其次,确保.csv文件不包含任何怪异的空白字符,如摘要here。在

相关问题 更多 >