解析区域字符串语言

2条回答

网友

1楼 · 编辑于 2024-10-02 10:22:48

>>> "IR05 měsíční (monthly)".decode('utf8')
u'IR05 m\u011bs\xed\u010dn\xed (monthly)'

它是原始字符串（用utf8编码）的unicode版本。在

现在，您可以将它与您解码的其他字符串（来自文件）进行比较（从utf8或latin2或其他格式），并可以对它们进行比较。在

^{pr2}$

现在可以比较两个unicode字符串：

>>> s_utf8 = "IR05 měsíční (monthly)"
>>> s_latin2 = 'IR05 m\xecs\xed\xe8n\xed (monthly)'
>>> s_utf8.decode('utf8') == s_latin2.decode('latin2')
True

要将字符串写入文件，encode请再次执行以下操作：

>>> s = s_utf8.decode('utf8')

>>> filehandle.write(s.encode('utf8'))

网友

2楼 · 编辑于 2024-10-02 10:22:48

错误可能是由str（j）引起的，试试这个：

for j in val:
    print 'j is - ', j
    j.replace("'", "")