擅长:python、mysql、java
<p>无法<code>unidecode('Entité')</code>,因为它已被解码为<code>'Entité'</code></p>
<p>您需要在源位置修复数据,它似乎是您的电子表格</p>
<p>看看<a href="https://stackoverflow.com/questions/45194771/are-xlsx-files-utf-8-encoded-by-definition">Are XLSX files UTF-8 encoded by definition?</a></p>
<p>以及:<a href="https://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.io.parsers.read_csv.html" rel="nofollow noreferrer">https://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.io.parsers.read_csv.html</a></p>
<p><code>encoding='utf-8'</code>参数被传递给一个底层的<code>pands.io.parsers.TextFileReader</code>对象,该对象盲目地接受您知道您的文件是在<code>UTF-8</code>中编码的,而这里的情况似乎不是这样</p>
<p>试试<code>utf-16</code>或<code>latin-1</code>,看看结果是否改变。处理这个问题的方法是找出文件实际使用的编码方式</p>
<p>XLSX格式是一个压缩的XML文档。将扩展名更改为zip,打开它并检查XML数据中的编码</p>
<p>您可以编写附带的代码,以便将来确定编码</p>