一组函数,使用sklearn执行TFIDF分析,从基于事件/分组的文本语料库生成关键字。

evekeys的Python项目详细描述


evekeys:从基于事件和自定义分组的文本语料库中分离关键字

作者:克里斯·林德格伦chris.a.lindgren@gmail.com

根据BSD 3条款许可证分发。看到了吗许可证.txt或http://opensource.org/licenses/BSD-3-Clause获取详细信息。在

文档https://evekeys.readthedocs.io/en/latest/

概述

使用scikit learn执行TF-IDF分析的一组函数,从基于事件的文档中分离关键字。它回答了以下问题:

  1. 哪些关键词代表某一特定时期的内容?在
  2. 哪些关键字代表特定时期的特定内容组?在

它假设您有:

  • 把你的语料库作为熊猫数据帧导入
  • 包括元数据信息,如日期列表和重新组织语料库的组列表,以及
  • 预处理您的文档。在

它只在python3.x上运行,不向后兼容。在

Warning:evekeys几乎不执行任何自定义错误处理,因此请确保输入的格式正确。如果您有任何问题,请通过电子邮件通知我。在

系统要求

  • 熊猫
  • 学习
  • 全面质量管理

安装

pip install evekeys

已知问题或限制

  • 如果您发现任何问题,请与我联系。在

示例笔记本

  • 马上就来。在

分发更新终端命令

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java文件路径中的java UTF8字符   java如何可靠地写入OPC UA服务器?   for-my-if语句中的java循环不能产生我想要的结果   java我如何在1个XSL中加入2个XML   macos无法在“/Library/Java/JavaVirtualMachines/jdk15.0.1.jdk/Contents/Home/bin/apt”中找到可执行文件   Java代码简单数学   java如何避免selenium中的sendKeys方法清除之前填充的文本?   java如何将PlacesAPI自动完成小部件传递到自定义对话框?   带有文本块的java Intellij json片段问题   启动时Spring启动错误:java。木卫一。IOException:jsse。别名\u否\u键\u项   移动文件时发生java异常   http Java Web客户端远程连接