我正在处理的德语文本,我想编码和解码,以摆脱一些字符。例如,假设我有
text = 'führt - möglich'
我想获得:
^{pr2}$如果我使用cp1252
对text
进行编码,并用utf8
对结果进行解码,我得到:
text.encode('cp1252').decode('utf8')
# 'führt - möglich'
第一个单词可以,但是第二个单词中还有一些字符需要替换。我可以第二次编码/解码
text.encode('cp1252').decode('utf8').encode('cp1252').decode('utf8', 'ignore')
# 'fhrt - möglich'
现在第二个单词可以了,但是第一个单词缺少ü
。在
我可以编写代码并使用这个debugging table,以及str.replace()
,来解决上述问题。但是,我想知道:给定text
,有没有一种方法可以使用encode
和{
目前没有回答
相关问题 更多 >
编程相关推荐