泰语自然语言处理库

pythainlp的Python项目详细描述


PyThaiNLP Logo

毕达因

pythainlp是一个用于泰语自然语言处理(nlp)的python库。

pythainlp包括泰语单词标记器、音译器、soundex转换器、部分语音标记器和拼写检查器。

在Facebook上关注我们PyThaiNLP

2.0有什么新功能?

安装

对于稳定版本:

pip install pythainlp

对于某些高级功能,如word vector,可能需要额外的包。在PIP安装期间,使用以下选项安装它们:

pip install pythainlp[extra1,extra2,...]

可提供额外服务的地方

  • artagger(支持artagger词性标记)*
  • deepcut(支持Deepcut机器学习的标记器)
  • icu(用于ICU在音译和标记化方面的支持)
  • ipa(用于音译中的国际音标支持)
  • ml(支持FastAI 1.0.22 ULMFIT机型)
  • ner(用于命名实体识别器)
  • thai2fit(泰语单词向量)
  • thai2rom(用于机器学习的罗马化)
  • full(安装所有组件)

note for windowsmarisa-trie可以从https://www.lfd.uci.edu/~gohlke/pythonlibs/#marisa-trie获得轮子 用pip安装,例如:pip install marisa_trie‑0.7.5‑cp36‑cp36m‑win32.whl

链接

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
Java无法调用扩展超级非抽象类的抽象类方法   java Hibernate 5关联[]引用了一个未映射的实体[]:origin(User.hbm.xml)   java禁用JSpinner中的数字分组   java Spring的环境抽象是否使用PropertyEditor?   java是否创建自定义注释作为FrameworkAnnotation的别名?   java如何将Selenium安装为Unix守护程序?   java三值if运算符在正则if-one中   有人能帮我在一个程序上分析java代码吗?   java Spring集成5.0反应堆类型支持   java Websphere 7线程转储分析   java Akka期货和监管策略如何应对失败   使用Clojure中的可选参数调用java函数的构造函数   java如何消除安卓按钮的延迟?   Android上使用X.509证书的java认证应用程序   java如何获取列表中特定类型的所有对象?   java如何将json数组字符串转换为json对象   安卓 Java从长时间返回的日期不正确   java Android Studio在尝试从TextEdit搜索单词时崩溃   ViewPager的java子项