擅长:python、mysql、java
<p><code>0x5d0</code>根本不是编码;它只是一个数字。是的,希伯来语字母ALEF是U+05D0,但是UTF-8不是码位到字节的转录。相反,它在每个字节的msb中使用一组固定的位,并用码位值的可变位数填充lsb。在</p>
<pre><code>0x5d0 = 101 1101 0000
= 10111 010000
</code></pre>
<p>插入<a href="http://en.wikipedia.org/wiki/UTF-8#Description" rel="noreferrer">110xxxxx 10xxxxxx</a>我们得到:</p>
^{pr2}$