2024-06-13 13:20:35 发布
网友
我现在正在开发一个小工具来请求和解码一个网页,在这个网页上,汉字被存储为类似字符串的形式
\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167
在源代码中,有点像unicode。我想把它转换成汉字。在
我可以通过这个网站http://rishida.net/tools/conversion/。但是如何使用python实现呢?在
这些都是Unicode编码点。它们表示汉字,但使用的转义码对开发人员来说更容易:
>>> print u'\u5c0f\u738b\u5b50\u003a\u6c49\u6cd5\u82f1\u5bf9\u7167' 小王子:汉法英对照
你不需要做任何事情来转换它们;\uxxxx转义形式只是表示相同代码点的另一种方法。见String Literals:
\uxxxx
\uxxxx Character with 16-bit hex value xxxx (Unicode only)\Uxxxxxxxx Character with 32-bit hex value xxxxxxxx (Unicode only)
\Uxxxxxxxx
Python在读取源代码以构造unicode值时解释这些转义码。在
如果数据源不是来自Python源代码而是来自web,那么您将使用JSON数据,它使用相同的转义格式:
请注意,该值需要是一个较大字符串的一部分,至少包含引号以将其标记为字符串。在
还要注意,JSON字符串转义格式在非BMP(补充)代码点时与Python的不同;JSON处理那些与UTF-16类似的代码点,creating a surrogate pair,并对这样的代码点使用两个\uxxxx序列。在Python中,您将使用一个\Uhhhhhhhh32位十六进制值。在
\Uhhhhhhhh
这些都是Unicode编码点。它们表示汉字,但使用的转义码对开发人员来说更容易:
你不需要做任何事情来转换它们;
\uxxxx
转义形式只是表示相同代码点的另一种方法。见String Literals:Python在读取源代码以构造unicode值时解释这些转义码。在
如果数据源不是来自Python源代码而是来自web,那么您将使用JSON数据,它使用相同的转义格式:
^{pr2}$请注意,该值需要是一个较大字符串的一部分,至少包含引号以将其标记为字符串。在
还要注意,JSON字符串转义格式在非BMP(补充)代码点时与Python的不同;JSON处理那些与UTF-16类似的代码点,creating a surrogate pair,并对这样的代码点使用两个
\uxxxx
序列。在Python中,您将使用一个\Uhhhhhhhh
32位十六进制值。在相关问题 更多 >
编程相关推荐