NLP,痉挛前后

textac的Python项目详细描述


文本性:NLP,间隔前后

textacy是一个python库,用于执行各种自然语言 处理(nlp)任务,构建在高性能spacy库上。与 基本原理——标记化、词性标注、依赖性分析等。--- 委托给另一个图书馆,textacy主要关注任务 先来后去。

build statuscurrent release versionpypi versionconda version

功能

  • 使用Spacy处理的一个或多个文档的便捷入口点,并通过自定义扩展添加功能
  • 各种可下载的数据集,包括文本内容和元数据,从国会演讲到历史文献再到reddit评论
  • 方便的文件I/O,用于将数据流式传输到磁盘或从磁盘流式传输数据
  • 原始文本的清理、规范化和探索-处理前
  • 词汇、NGG、名词块、实体、首字母缩略词、关键术语和其他感兴趣元素的灵活提取
  • 文档的标记化和矢量化,具有培训、解释和可视化主题模型的功能
  • 通过各种度量进行字符串、集合和文档相似性比较
  • 通用文本统计的计算,包括Flesch Kincaid等级和多语言Flesch阅读简易性

及更多!

链接

维修人员

你们好。

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
如何在Java中比较忽略大小写的字符串   Swing应用程序中的java本机接口Jni字体错误   在maven spark java应用程序中运行html文件的javascript   JavaMaven和jboss模块   会话过期后java自动注销   java Android警报对话框强制关闭错误   java为分级栏添加边距/填充   java JPanel在使用BoxLayout时不会调整大小   java如何在编辑JTable的JSpinner单元格后重新应用或重新提交我的JTable   java异步任务FTP上载Android服务崩溃?   java如何从对象列表中获取字符串属性数组   java在许多片段中使用BroadcastReceiver   java Sockets聊天应用NotSerializableException   Java audio无法在Linux中播放wav文件   空的花括号/大括号在Java中是什么意思?   intellij idea如何告诉草书Clojure模块依赖于本地Java/Scala模块?   swing Java键绑定在按住键的同时触发按下和释放   当使用via时,java Log4j不显示行记录。jar文件