读取.json文件并将unicode数据转换为utf8 - 问答 - Python中文网

读取.json文件并将unicode数据转换为utf8

2024-09-30 01:30:38 发布

您现在位置：Python中文网/ 问答频道 /正文

男 | 程序猿一只，喜欢编程写python代码。

我从未真正理解python中的编码和解码是如何工作的，我习惯于经常遇到此类问题。我必须读取一个json文件，并将它的一些值与其他数据进行比较

在其中一个文件中，我有一个字符串BAIXA DA INSCRI\u00c7\u00c3O ESTADUAL，它应该变成BAIXA DA INSCRICAO ESTADUAL。我是这样读文件的：

with codecs.open(filepath, 'r') as file:
    filedata = json.loads(file.read())

但是，字符串被读取为unicode，并表示为u'BAIXA DA INSCRI\xc7\xc3O ESTADUAL'

如何实现这一点，以及如何使用python中的编解码器

Tags：文件数据字符串 json 编码 with 解码 da

1条回答

网友

1楼 · 发布于 2024-09-30 01:30:38

看起来您想从文本中删除任何发音符号。您可以尝试使用unicode的标准格式D（用于分解）并过滤掉高位代码：

txt = u'BAIXA DA INSCRI\xc7\xc3O ESTADUAL'
txt = u''.join(i for i in unicodedata.normalize('NFD', t) if ord(i) < 128).encode('ASCII')

它应该给出（字节）字符串：

'BAIXA DA INSCRICAO ESTADUAL'

相关问题更多 >

编程相关推荐

热门问题

热门文章