擅长:python、mysql、java
<p>这里所有现有的答案都将中日韩(代表汉语、日语和韩语)字符与韩语字符(仅代表中文)混淆。在</p>
<p>判断一个汉字是不是中日韩很容易,但很难判断一个汉字是否是汉字,而且标准在不断变化,新的汉字总是不断增加。在</p>
<p>但在实际操作中,人们通常使用<strong>u'\u4e00'-u'\u9fa5'</strong>来检查一个字符。超出此范围的中日韩字符通常无法用普通中文字体显示。在</p>
<p>有时<a href="http://www.unicode.org/charts/PDF/U2E80.pdf" rel="nofollow">CJK Radicals Supplement</a>、<a href="http://www.unicode.org/charts/PDF/U3100.pdf" rel="nofollow">Bopomofo</a>、<a href="http://www.unicode.org/charts/PDF/U31C0.pdf" rel="nofollow">CJK Strokes</a>也应视为字符,它们甚至不在中日韩统一汉字('\u4e00'-u'\u9fff')中,但它们在汉语书写系统中是常见而重要的。在</p>
<p>参考文献:</p>
<p><a href="http://en.wikipedia.org/wiki/CJK" rel="nofollow">CJK characters</a></p>
<p><a href="http://en.wikipedia.org/wiki/CJK_Unified_Ideographs" rel="nofollow">CJK Unified Ideographs</a></p>
<p>{a6}</p>
<p><a href="http://cpansearch.perl.org/src/GUS/Unicode-UTF8simple-1.06/gb2312.txt" rel="nofollow">GB 2312 to Unicode</a></p>
<p><a href="http://examples.oreilly.com/cjkvinfo/unicode/gb12345-90.txt" rel="nofollow">GB 12345 to Unicode</a></p>