Python:西里尔文处理

2024-09-28 21:38:34 发布

您现在位置:Python中文网/ 问答频道 /正文

我从一个API返回了b'\\u041a\\u0435\\u0439\\u0442\\u043b\\u0438\\u043d\\u043f\\u0440\\u043e的数据。这些数据是俄文的,我肯定知道。我猜这些值是西里尔字母的unicode表示?在

返回的数据是字节数组。在

如何将其转换为可读的西里尔字母字符串?我非常需要一种方法来将这种类型的文本转换成可读的文本。在

编辑:是的,这是JSON数据。忘了提,对不起。在


Tags: 数据文本api字母unicodeu043du0438u0442
1条回答
网友
1楼 · 发布于 2024-09-28 21:38:34

很可能您有JSON数据;JSON使用\uhhhh转义序列来表示Unicode代码点。使用^{} functiononunicode(解码)数据生成一个Python字符串:

import json

string = json.loads(data.decode('utf8'))

UTF-8是默认的JSON编码;检查响应头(如果您使用的是基于HTTP的API)以查看是否使用了不同的编码。在

演示:

^{pr2}$

相关问题 更多 >