在python中将非“utf8”特征化文件中的字符转换为英语等效字符

2024-09-28 22:42:57 发布

男 | 程序猿一只，喜欢编程写python代码。

我的档案里有这样几行字：

M  Aad                                  4                                             $
M  Aadam                                          1                                   $
F  Aadje                                1                                             $
M  Ådne                      +                 1                                      $

当我运行以下代码时

#!/usr/bin/python
# -*- coding: utf-8 -*-

import csv, unicodedata, urllib
from unidecode import unidecode
from textblob import TextBlob

with open('names.csv', 'rb') as f:
    reader = csv.reader(f)
    my_list = list(reader)

for a in range(len(my_list)):
        name = my_list[a][0]
        name = unicode(name,'ISO-8859-15')
        print name

我在一些线路上得到这样的输出：

F  <Z^>ydr<edeg>                                      1                                 $

对于这个例子，在stackoverflow上有很多类似的问题，但是他们的解决方案不适合我的问题。你知道吗

我怎样才能解决这个问题？你知道吗

Tags： csv 代码 name from import my 档案 list

1条回答

网友

1楼 · 发布于 2024-09-28 22:42:57

听起来您的输入实际上不是UTF-8，它似乎是ISO-8859-*（可能是ISO-8859-15或ISO-8859-1），0xC5是Å的ISO编码（UTF-8编码应该是0xC3 0xA5）。你知道吗

在python中将非“utf8”特征化文件中的字符转换为英语等效字符

相关问题更多 >

编程相关推荐

热门问题

热门文章

在python中将非“utf8”特征化文件中的字符转换为英语等效字符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >