我从未真正理解python中的编码和解码是如何工作的,我习惯于经常遇到此类问题。我必须读取一个json文件,并将它的一些值与其他数据进行比较
在其中一个文件中,我有一个字符串BAIXA DA INSCRI\u00c7\u00c3O ESTADUAL
,它应该变成BAIXA DA INSCRICAO ESTADUAL
。我是这样读文件的:
with codecs.open(filepath, 'r') as file:
filedata = json.loads(file.read())
但是,字符串被读取为unicode,并表示为u'BAIXA DA INSCRI\xc7\xc3O ESTADUAL'
如何实现这一点,以及如何使用python中的编解码器
看起来您想从文本中删除任何发音符号。您可以尝试使用unicode的标准格式D(用于分解)并过滤掉高位代码:
它应该给出(字节)字符串:
相关问题 更多 >
编程相关推荐