UTF8错误编码,找出错误编码的方式

2024-05-19 22:25:50 发布

您现在位置:Python中文网/ 问答频道 /正文

首先,我搜索了论坛和网络,找到了一些或多或少相关的线索,但并没有真正指向我的问题

我知道我使用的字符串格式不正确,我发现了两个指向发生了什么的站点(双utf以某种方式与iso-8859-1相结合)

http://www.i18nqa.com/debug/utf8-debug.html
https://gist.github.com/ImpactSeo/78561612047efa7591264b8276357a4b

使用这些列表进行反转相对比较容易,但我试图理解如何使用这些坏字符串

到目前为止我做了什么

我知道“畸形”代表“畸形”,所以我从“畸形”开始

Äutf8编码为\xc3\x84字符串 当我第二次使用utf8编码时

\xc3\x83\xc2\x84

非常接近“期望的”输出,但另一方面,格式错误的字符串看起来像

Ä is \xc3\x83\xe2\x80\x9e encoded in utf-8

谁能给我一个提示或告诉我怎么去那里?我尝试了不同的方法将utf-8与iso-8859-1结合起来,但没有输出匹配


Tags: 字符串debug网络com编码格式isoutf8