擅长:python、mysql、java
<p>如果您需要Latin-1编码,您可以使用多个选项来消除255以上的短划线或其他代码点(Latin-1中不包含的字符):</p>
<pre><code>>>> u = u'hello\u2013world'
>>> u.encode('latin-1', 'replace') # replace it with a question mark
'hello?world'
>>> u.encode('latin-1', 'ignore') # ignore it
'helloworld'
</code></pre>
<p>或者自己定制替换:</p>
<pre><code>>>> u.replace(u'\u2013', '-').encode('latin-1')
'hello-world'
</code></pre>
<p>如果您不需要输出拉丁语-1,那么UTF-8是一个常见且首选的选择。W3C推荐使用它,并对所有Unicode代码点进行了良好的编码:</p>
<pre><code>>>> u.encode('utf-8')
'hello\xe2\x80\x93world'
</code></pre>