为Python打包的UniDic
unidic的Python项目详细描述
单面打印
这是打包使用的UniDic版本 用皮普。在
目前它支持UniDic的最新版本2.3.0。注意这将 安装后需要占用1GB的磁盘空间,下载可能需要很长时间。如果 你想要一个小包裹,试试看 unidic-lite。在
通过pip安装后,您需要使用 以下命令:
python -m unidic download
带fugashi或 mecab-python3将使用unidic 安装时自动进行,但如果需要,可以手动传递 MeCab参数:
^{pr2}$与官方的UniDic版本不同
这与UniDic的官方版本相比有一些改动,使其更易于使用。在
- 已添加条目
- 单字符数字和字母单词已被删除
unk.def
已被修改,因此未知标点不会标记为名词
有关如何复制生成过程的详细信息,请参见extras
目录。在
许可证
现代日本UniDic在GPL、LGPL或BSD许可下可用, see here。UniDic是 由NINJAL开发,国家研究所 日语和语言学。UniDic版权归UniDic所有 根据BSD License条款在这里分发。在
这个存储库中的代码不是由NINJAL编写或维护的。代码是 可根据您的喜好,在麻省理工学院或WTFPL许可证下使用。在
- 项目
标签: