擅长:python、mysql、java
<p>您需要将从文件中读取的bytestrings转换为Unicode字符串。看一下您的代码,我将在解析函数中执行此操作,即用如下内容替换<code>stripnulls</code></p>
<pre><code>def stripnulls_and_decode(data):
return codecs.utf_8_decode(data.replace("\00", "")).strip()
</code></pre>
<p>注意,只有当文件中的字符串实际上是用UTF-8编码的时候,这才起作用——如果它们是用不同的编码,那么您必须使用来自<code>codecs</code>模块的相应解码函数。</p>