术语频率–反向文档频率(TFIDF)Python库
py4tfidf的Python项目详细描述
py4tfidf公司
Term Frequency–反向文档频率(TF-IDF)Python库
入门
本项目是用python编程语言实现TF-IDF算法。在
先决条件
Numpy公司
安装
安装py4tfidf最简单的方法是使用pip
pip install py4tfidf
用法
有两个Tfidf
类的公共方法。它是vectorize_train
和{vectorize_train
用于建立语料库,根据训练文本计算idf,并将其tf与idf相乘转化为可用向量,而{vectorize_train
和{vectorize_train
和{
- 项目
标签: