Unicode解码错误在连接中

stats_list = ['Statistik \xc3\xb6ver s\xc3\xa5nger\n', 'Antal\tS\xc3\xa5ng', '1\tCarola - Betlehems Stj\xc3\xa4rna', '\n\nStatistik \xc3\xb6ver datak\xc3\xa4llor\n', 'K\xc3\xa4lla\tAntal', 'MANUAL\t1', '\n\nStatistik \xc3\xb6ver \xc3\xb6nskare\n', 'Antal\tId', u'1\tNiclas']

Traceback (most recent call last): File "./CyberJukebox.py", line 489, in on_stats_to_clipboard stats = self.jbox.get_stats() File "/home/nine/dev/python/CyberJukebox/jukebox.py", line 235, in get_stats return self._stats.get_string() File "/home/nine/dev/python/CyberJukebox/jukebox.py", line 59, in get_string return '\n'.join(i.decode('utf8') for i in stats_list) File "/home/nine/dev/python/CyberJukebox/jukebox.py", line 59, in <genexpr> return '\n'.join(i.decode('utf8') for i in stats_list) File "/usr/lib/python2.7/encodings/utf_8.py", line 16, in decode return codecs.utf_8_decode(input, errors, True) UnicodeEncodeError: 'ascii' codec can't encode character u'\xf6' in position 10: ordinal not in range(128)

def get_string(self): stats_list = [u'Statistik över sånger\n', u'Antal\tSång'] stats = sorted([(v, k) for k, v in self.song_stats.iteritems()], reverse=True) for row in stats: line = '%s\t%s' % row stats_list.append(line) stats_list.append(u'\n\nStatistik över datakällor\n') stats_list.append(u'Källa\tAntal') stats = sorted([(k, v) for k, v in self.exts_stats.iteritems()]) for row in stats: line = '%s\t%s' % row stats_list.append(line) stats_list.append(u'\n\nStatistik över önskare\n') stats_list.append(u'Antal\tId') stats = sorted([(v, k) for k, v in self.wisher_stats.iteritems() if k != ''], reverse=True) for row in stats: line = '%s\t%s' % row stats_list.append(line) return '\n'.join(i.decode('utf8') for i in stats_list)

3条回答

网友

1楼 · 编辑于 2024-09-24 22:24:35

字符串用UTF-8编码。你需要.decode把它们转换成unicode：

>>> 'Statistik \xc3\xb6ver s\xc3\xa5nger\n'.decode('utf-8')
u'Statistik \xf6ver s\xe5nger\n'
>>> print _
Statistik över sånger

使用“理解”对所有元素执行此操作：

return '\n'.join(x.decode('utf-8') for x in stats_list)

网友

2楼 · 编辑于 2024-09-24 22:24:35

Python抱怨它无法将字符串'Statistik \xc3\xb6ver s\xc3\xa5nger\n'转换为ASCII字符串。尝试用u作为所有UNICODE字符串的前缀。

stats_list = [u'Statistik \xc3\xb6ver s\xc3\xa5nger\n', u'Antal\tS\xc3\xa5ng', u'1\tCarola - Betlehems Stj\xc3\xa4rna', u'\n\nStatistik \xc3\xb6ver datak\xc3\xa4llor\n', u'K\xc3\xa4lla\tAntal', u'MANUAL\t1', u'\n\nStatistik \xc3\xb6ver \xc3\xb6nskare\n', u'Antal\tId', u'1\tNiclas']

网友

3楼 · 编辑于 2024-09-24 22:24:35

您的问题可能是您将unicode字符串与字节字符串混合在一起。

“Edit 2”中的代码有几个unicode字符串被添加到stats_list：

stats_list = [u'Statistik över sånger\n', u'Antal\tSång']

如果您尝试解码这些unicode字符串，您将得到一个UnicodeEncodeError。这是因为Python将首先尝试使用默认编码（通常是“ascii”）对字符串进行编码，然后再尝试对字符串进行解码。只有解码字节字符串才有意义。

因此，首先，将函数中的最后一行更改为：

return '\n'.join(stats_list)

现在您需要检查添加到stats_list的其他字符串是否是byte字符串，并确保它们首先被正确解码为unicode字符串。

所以在这三行后面加上print type(line)：

line = '%s\t%s' % row

然后在打印<type 'str'>的地方，将下面的行更改为：

stats_list.append(line.decode('utf-8'))

当然，如果它打印<type 'unicode'>，就不需要更改下面的行。

这里一个更好的解决方案是检查词典song_stats、exts_stats和wisher_stats是如何创建的，并确保它们始终包含unicode字符串（或只包含ascii字符的字节字符串）。

相关问题更多 >

编程相关推荐

热门问题

热门文章