在Python中对德语文本进行编码和解码

2024-06-25 07:18:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在处理的德语文本,我想编码和解码,以摆脱一些字符。例如,假设我有

text = 'führt - möglich'

我想获得:

^{pr2}$

如果我使用cp1252text进行编码,并用utf8对结果进行解码,我得到:

text.encode('cp1252').decode('utf8')
# 'führt - möglich'

第一个单词可以,但是第二个单词中还有一些字符需要替换。我可以第二次编码/解码

text.encode('cp1252').decode('utf8').encode('cp1252').decode('utf8', 'ignore')
# 'fhrt - möglich'

现在第二个单词可以了,但是第一个单词缺少ü。在

我可以编写代码并使用这个debugging table,以及str.replace(),来解决上述问题。但是,我想知道:给定text,有没有一种方法可以使用encode和{}来获得{}?在


Tags: text文本编码utf8解码字符单词encode