在Python中，Unescape unicodescape，但不包括回车和换行

1条回答

网友

1楼 · 发布于 2024-10-01 13:24:43

当然有，使用适合作业的工具并要求^{} module将数据解码为Python unicode；然后将结果编码为UTF-8：

import json

json.loads(input).encode('utf8')

仅对实际的Python字符串文本使用unicode-escape。JSON字符串与Python字符串不同，尽管乍一看，它们看起来非常相似。在

简短的演示（考虑到python交互式解释器将字符串作为文本进行回显）：

^{pr2}$

注意，JSON解码器对\r进行解码，就像python文本一样。在

如果您绝对要只处理JSON输入中的\uabcdunicode文本，而保留其余内容，则需要使用正则表达式：

import re

codepoint = re.compile(r'(\\u[0-9a-fA-F]{4})')
def replace(match):
    return unichr(int(match.group(1)[2:], 16))

codepoint.sub(replace, text).encode('utf8')

它给出了：

>>> codepoint.sub(replace, r'\u201cquotes\u201d').encode('utf8')
'\xe2\x80\x9cquotes\xe2\x80\x9d'
>>> codepoint.sub(replace, r'"foo\r\nbar"').encode('utf8')
'"foo\\r\\nbar"'

相关问题更多 >

编程相关推荐

热门问题

热门文章

在Python中，Unescape unicodescape，但不包括回车和换行

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >