阅读JSON:\u00c5\u0082的编码是什么?如何将其转换为Unicode对象?

2024-06-26 13:56:50 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在解析的JSON文件中的一个值是Wroc\u00c5\u0082aw。我如何将这个字符串转换成一个unicode对象来生成“Wrocław”(在本例中,这是正确的解码方式)?在


Tags: 文件对象字符串json方式unicode解码aw
2条回答

您的JSON似乎没有正确的编码,因为\u00c5和\u0082aw都不会产生任何编码中预期的字符。在

但是你可以试着用UTF8或UTF16来编码这个值

不管生成什么进程,JSON都会将UTF-8编码的文本误认为是拉丁语1编码的文本。要修复错误,请反向运行相同的进程:

>>> u'Wroc\u00c5\u0082aw'.encode('iso-8859-1').decode('utf-8')
u'Wroc\u0142aw'
>>> import unicodedata
>>> unicodedata.name(u'\u0142')
'LATIN SMALL LETTER L WITH STROKE'

相关问题 更多 >