我有一个关于Python2编码的问题。我试图解码一个ASCII字符串,其中包含一个字母的Unicode代码,然后将其编码回拉丁语-1,但没有成功。下面是一个例子:
In[27]: d = u'\u010d'
In[28]: print d.encode('utf-8')
č
In[29]: d1 = '\u010d'
In[30]: d1.decode('ascii').encode('utf-8')
Out[30]: '\\u010d'
我想将'\u010d'
转换为'č'
。是否有任何内置的解决方案来避免自定义字符串替换?在
Tags:
当你这么做的时候
你实际上得到了这个字符串:
^{pr2}$这是因为“normal”(非Unicode)字符串无法识别
\unnnn
转义序列,因此将其转换为文本反斜杠,后跟unnnn
。在为了解码,您需要使用^{} codec :
当然,首先不应该在非Unicode字符串中使用Unicode转义序列。在
相关问题 更多 >
编程相关推荐