我正在分析一个xml文件,它的编码是“iso-8859-15”。在
像“Zürich”、“Aktienr ruckk”这样的词会被转换成“&;228;”等等
我尝试了以下建议:
p = ElementTree.fromstring(u'<p>found "\u62c9\u67cf \u591a\u516c \u56ed"</p>'.encode('utf8'))
>>> p.text
u'found "\u62c9\u67cf \u591a\u516c \u56ed"'
>>> print p.text
但我会遇到类似UnicodeDecodeError: 'ascii' codec can't decode byte
的错误
即使这样也无济于事
^{pr2}$我试过很多关于堆栈溢出的建议,但是我想不出我的办法。在
我需要将解析后的内容写回一个html文件,其中包含相同的字符集,比如'u'
试试这个:
例如:
^{pr2}$别忘了把
# -*- coding: utf-8 -*-
放在文件的开头。在相关问题 更多 >
编程相关推荐