Python2.7：如何将字符串中的unicode转义符转换为实际的utf8字符

2条回答

网友

1楼 · 编辑于 2024-09-27 07:17:58

试试看

>>> s = "<a href = \"http://www.mypage.com/\\u0441andmoretext\">\\u00b2<\\a>"
>>> s.decode("raw_unicode_escape")
u'<a href = "http://www.mypage.com/\u0441andmoretext">\xb2<\\a>'

然后你可以像往常一样编码成utf8。在

网友

2楼 · 编辑于 2024-09-27 07:17:58

Python确实包含了一些针对这种情况的特殊字符串编解码器。在

在这种情况下，如果32-127范围之外没有其他字符，则可以使用“unicode_escape”编解码器安全地解码字节字符串，以便在Python中有一个正确的unicode文本对象。（您的程序应该在其上执行所有文本操作）- 每当您再次输出该文本时，您会像往常一样将其转换为utf-8：

rawtext = r"""<a href="http://www.mypage.com/\u0441andmoretext">\u00b2<\a>"""
text = rawtext.decode("unicode_escape")
# Text operations go here
...
output_text = text.encode("utf-8")

如果32-127范围之外还有其他字节，则unicode_转义编解码器假设它们是拉丁1编码。因此，如果您的响应混合了utf-8和这些\uxxx序列，您必须：

使用utf-8解码原始字符串
编码回拉丁1
使用“unicode_escape”解码
练习课文
编码回utf-8

相关问题更多 >

编程相关推荐

热门问题

热门文章

Python2.7：如何将字符串中的unicode转义符转换为实际的utf8字符

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >