读取.json文件并将unicode数据转换为utf8

2024-09-30 01:30:38 发布

您现在位置:Python中文网/ 问答频道 /正文

我从未真正理解python中的编码和解码是如何工作的,我习惯于经常遇到此类问题。我必须读取一个json文件,并将它的一些值与其他数据进行比较

在其中一个文件中,我有一个字符串BAIXA DA INSCRI\u00c7\u00c3O ESTADUAL,它应该变成BAIXA DA INSCRICAO ESTADUAL。我是这样读文件的:

with codecs.open(filepath, 'r') as file:
    filedata = json.loads(file.read())

但是,字符串被读取为unicode,并表示为u'BAIXA DA INSCRI\xc7\xc3O ESTADUAL'

如何实现这一点,以及如何使用python中的编解码器


Tags: 文件数据字符串json编码with解码da
1条回答
网友
1楼 · 发布于 2024-09-30 01:30:38

看起来您想从文本中删除任何发音符号。您可以尝试使用unicode的标准格式D(用于分解)并过滤掉高位代码:

txt = u'BAIXA DA INSCRI\xc7\xc3O ESTADUAL'
txt = u''.join(i for i in unicodedata.normalize('NFD', t) if ord(i) < 128).encode('ASCII')

它应该给出(字节)字符串:

'BAIXA DA INSCRICAO ESTADUAL'

相关问题 更多 >

    热门问题