python中的Unicode编码错误

2024-09-29 23:14:59 发布

您现在位置:Python中文网/ 问答频道 /正文

我的数据中有字符\u002d、\u2019、u\2022、\u25ba、\u2013等。 我得做json.loads(data)

我试过了

data1 = data.encode('utf-8')
json.loads(data1)

我还是有个错误。在

也尝试了下面的方法,但最终出现了一个错误

^{pr2}$

如果我将数据中的字符(如“\u002d”替换为“-”)就可以了,但我不知道还有哪些字符会潜入其中。所以我正在寻找一个解决方案,将这些字符编码


Tags: 数据方法jsondata错误字符utfencode
1条回答
网友
1楼 · 发布于 2024-09-29 23:14:59

不需要对数据进行编码。在

将其直接输入到json.loads();JSON标准使用\u....转义码来表示unicode值。在

这些值不是用UTF-8编码的,Pythonjson模块将为您处理它们。在

即使数据是用UTF-8编码的,json模块也会为您处理这些问题。即使它没有,你也应该使用str.decode(),而不是编码。在

UTF-8数据看起来也不一样;U+2019代码点看起来像:

>>> u'\u2019'.encode('utf8')
'\xe2\x80\x99'

当编码为UTF-8时。在

相关问题 更多 >

    热门问题