在Python中从.CSV检索并显示UTF8

Traceback (most recent call last): File "surname_generator.py", line 39, in probfamilynames = [(familyname,float(prob)) for familyname,prob in unicode_csv_reader(open(familynamelist))] File "surname_generator.py", line 27, in unicode_csv_reader for row in csv_reader: File "surname_generator.py", line 33, in utf_8_encoder yield line.encode('utf-8') UnicodeDecodeError: 'ascii' codec can't decode byte 0xef in position 0: ordinal not in range(128)

3条回答

网友

1楼 · 编辑于 2024-09-30 02:15:08

你当前的问题是csv-unicode-u阅读器给了你一个糟糕的选择。顾名思义，正如文件中明确指出的：

“”是一个生成器，用于包装csv.reader处理Unicode CSV数据（Unicode字符串列表）。“”“在

你没有unicode字符串，你有用UTF-8编码的str字符串。在

建议：把csv_unicode_阅读器的东西吹走。简单明了地获取每一行，就好像它是用ascii编码的一样。然后将每行转换为unicode：

unicode_row = [field.decode('utf8') for field in str_row]

回到原来的问题：

（1）要获得字体等方面的帮助，您需要说明您在哪个平台上运行，以及您使用什么软件来显示unicode字符串。在

（2）如果您希望以独立于平台的方式检查数据，请查看repr（）内置函数和unicodedata模块中的name函数。在

网友

2楼 · 编辑于 2024-09-30 02:15:08

python文档中有unicode_csv_阅读器演示： http://docs.python.org/library/csv.html

网友

3楼 · 编辑于 2024-09-30 02:15:08

unicode_csv_reader(open(familynamelist))正试图将非unicode数据（带utf-8编码的字节字符串）传递给您编写的预期unicode数据的函数。你可以用编解码器.打开（来自标准库模块编解码器），但这是迂回：编解码器将为您执行utf8->；unicode，然后您的代码将执行unicode->；utf8，有什么意义？在

相反，定义一个更像这样的函数…：

def encoded_csv_reader_to_unicode(encoded_csv_data,
                                  coding='utf-8',
                                  dialect=csv.excel,
                                  **kwargs):
  csv_reader = csv.reader(encoded_csv_data,
                          dialect=dialect,
                          **kwargs)
  for row in csv_reader:
      yield [unicode(cell, coding) for cell in row]

并使用encoded_csv_reader_to_unicode(open(familynamelist))。在

相关问题更多 >

编程相关推荐

热门问题

热门文章