解析区域字符串语言

2024-10-02 10:22:48 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在使用python进行exel解析。
到目前为止,我一直在学习英语,但当我遇到地区语言时,我就犯了错误。在

示例:

IR05 měsíční (monthly)

它给我的错误是

^{2}$

我怎样才能解析它,然后在输出文件中用同样的语言写呢?在

我的代码:

for j in val:
    print 'j is - ', j
    str(j).replace("'", "")

我在替换语句时出错。在


Tags: 文件代码in语言示例foris错误
2条回答
>>> "IR05 měsíční (monthly)".decode('utf8')
u'IR05 m\u011bs\xed\u010dn\xed (monthly)'

它是原始字符串(用utf8编码)的unicode版本。在

现在,您可以将它与您解码的其他字符串(来自文件)进行比较(从utf8或latin2或其他格式),并可以对它们进行比较。在

^{pr2}$

现在可以比较两个unicode字符串:

>>> s_utf8 = "IR05 měsíční (monthly)"
>>> s_latin2 = 'IR05 m\xecs\xed\xe8n\xed (monthly)'
>>> s_utf8.decode('utf8') == s_latin2.decode('latin2')
True

要将字符串写入文件,encode请再次执行以下操作:

>>> s = s_utf8.decode('utf8')

>>> filehandle.write(s.encode('utf8'))

错误可能是由str(j)引起的, 试试这个:

for j in val:
    print 'j is - ', j
    j.replace("'", "")

相关问题 更多 >

    热门问题