在https://github.com/twitter/twitter-korean-text中连接到normalizer的python端口
twitter-korean的Python项目详细描述
twitter-korean-py将{a4}的标领代码 参考后用PISUN重新编码的现场库。
-
现在只有正规化(normalizer)才可以,其余功能(to大化,语根化,语句提取)还没有实现。
- JPype使用Rapper接口twkorean不同,twitter-korean-text的标签/不使用的纯粹派SUN(pure-python)代码。
- 安装脚本在twitter-korean-text的maven repository中运载JAR文件后,只将字典文件取消。
-
《li》这个概念参考了twkorean。
在- Python 2.7中使用maven-artifact这个工具可以没有maven安装。 在
- Python 3.x中直接运行maven(mvn)下载。
Examplees
^{pri 1}}$