擅长:python、mysql、java
<p>给定一个每行包含json对象的utf-8文件,您可以读取所有对象:</p>
<pre><code>with open(filename) as file:
jlogs = [json.loads(line) for line in file]
</code></pre>
<p>除嵌入换行符处理外,上述代码应产生与您相同的结果:</p>
^{2}$
<p>此时,<code>jlogs</code>中的所有字符串都是Unicode,您不需要做任何事情来处理“特殊”字符</em>。只需确保代码中没有混合字节和Unicode文本。在</p>
<ul>
<li>要从字节中获取Unicode文本:<code>some_bytes.decode(character_encoding)</code></li>
<li>要从Unicode文本中获取字节:<code>some_text.encode(character_encoding)</code></li>
</ul>
<p>不编码字节/解码Unicode。在</p>