kakasi-kana汉字简单倒排库的python实现
pykakasi的Python项目详细描述
皮卡卡西一瞥
安装:
pip install pykakasi
示例源代码:
$ python >>> import pykakasi >>> >>> text = u"かな漢字交じり文" >>> kakasi = pykakasi.kakasi() >>> kakasi.setMode("H","a") # Hiragana to ascii, default: no conversion >>> kakasi.setMode("K","a") # Katakana to ascii, default: no conversion >>> kakasi.setMode("J","a") # Japanese to ascii, default: no conversion >>> kakasi.setMode("r","Hepburn") # default: use Hepburn Roman table >>> kakasi.setMode("s", True) # add space, default: no separator >>> kakasi.setMode("C", True) # capitalize, default: no capitalize >>> conv = kakasi.getConverter() >>> result = conv.do(text) >>> print(result) kana Kanji Majiri Bun >>> >>> >>> wakati = pykakasi.wakati() >>> conv = wakati.getConverter() >>> result = conv.do(text) >>> print(result) かな 漢字 交じり 文 >>> >>> kakasi = pykakasi.kakasi() >>> kakasi.setMode("J","aF") # Japanese to furigana >>> kakasi.setMode("H","aF") # Japanese to furigana >>> conv = kakasi.getConverter() >>> result = conv.do(text) >>> print(result) かな[kana] 漢字[Kanji] 交じり[Majiri] 文[Bun] >>>
您可以使用“h”、“k”、“a”中的输出模式 “平假名”、“片假名”和“字母表”。 对于输入,您可以使用“j”表示“日语”,即 汉字、片假名和平假名的混合体。 还有“h”、“k”的值,意思是“平假名”和“片假名”。 您可以使用“赫本”,“昆瑞”或“护照”作为模式“R”,罗马表开关。 另外“S”用于分隔符开关,“C”用于大写开关。 “S”表示分离器存储选项。
wakati是kakasi的wakati-gaki选项的实现。
文档
手册放在readthedocs上。
版权和许可
版权所有2010-2019 Hiroshi Miura<;miurahr@linux.com>;
此程序是免费软件:您可以重新分发和/或修改 根据由 自由软件基金会,或者许可证的第3版,或者 (由您选择)任何更高版本。
这个程序的发布是希望它能有用, 但没有任何保证;甚至没有 适销性或适合某一特定目的的适销性。见 GNU通用公共许可证了解更多详细信息。
你应该收到GNU通用公共许可证的副本 还有这个节目。如果没有,请参见<;http://www.gnu.org/licenses/>;。