一组函数,使用sklearn执行TFIDF分析,从基于事件/分组的文本语料库生成关键字。
evekeys的Python项目详细描述
evekeys:从基于事件和自定义分组的文本语料库中分离关键字
作者:克里斯·林德格伦chris.a.lindgren@gmail.com
根据BSD 3条款许可证分发。看到了吗许可证.txt或http://opensource.org/licenses/BSD-3-Clause获取详细信息。在
文档:https://evekeys.readthedocs.io/en/latest/
概述
使用scikit learn执行TF-IDF分析的一组函数,从基于事件的文档中分离关键字。它回答了以下问题:
- 哪些关键词代表某一特定时期的内容?在
- 哪些关键字代表特定时期的特定内容组?在
它假设您有:
- 把你的语料库作为熊猫数据帧导入
- 包括元数据信息,如日期列表和重新组织语料库的组列表,以及
- 预处理您的文档。在
它只在python3.x上运行,不向后兼容。在
Warning:evekeys几乎不执行任何自定义错误处理,因此请确保输入的格式正确。如果您有任何问题,请通过电子邮件通知我。在
系统要求
- 熊猫
- 学习
- 全面质量管理
安装
pip install evekeys
已知问题或限制
- 如果您发现任何问题,请与我联系。在
示例笔记本
- 马上就来。在
分发更新终端命令
- 项目
标签: