韩语字符的java排序和分组(不熟悉韩语)
我正在尝试用Java对韩语字符进行排序和分组
目前,我将使用
final Collator collator = Collator.getInstance(Locale.KOREA);
Collections.sort(words, collator);
然而,我很难把它们分成元音组(ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎ)
你可以在下面搜索框中键入要查询的问题!
我正在尝试用Java对韩语字符进行排序和分组
目前,我将使用
final Collator collator = Collator.getInstance(Locale.KOREA);
Collections.sort(words, collator);
然而,我很难把它们分成元音组(ㄱㄴㄷㄹㅁㅂㅅㅇㅈㅊㅋㅌㅍㅎ)
# 1 楼答案
这应该不会太难,尽管我不确定以前是否已经这样做过
你要做的是取下第一个Unicode字母。在Unicode中,所有的韩语字母都是按照维基百科http://en.wikipedia.org/wiki/Korean_language_and_computers#Example中很好地描述的公式组成的
所以你可以用一个公式来分解它:
使用wikipedia文章中提到的密钥,您可以做类似的事情(我使用Groovy,因为它更简单,但我相信您可以将其应用于Java)
要查看此代码的实际操作,请参阅https://groovyconsole.appspot.com/script/5767123439714304