按tfidf对TfidfVectorizer输出进行排序（从最低到最高，反之亦然）

from sklearn.feature_extraction.text import TfidfVectorizer tfidf = TfidfVectorizer(analyzer='word', stop_words = 'english') # fit_transform on training data X_traintfidf = tfidf.fit_transform(X_train)

1条回答

网友

1楼 · 发布于 2024-10-01 09:17:02

在fit_transform()之后，您将可以通过get_feature_names()方法访问现有词汇表。您可以这样做：

terms = tfidf.get_feature_names()

# sum tfidf frequency of each term through documents
sums = X_traintfidf.sum(axis=0)

# connecting term to its sums frequency
data = []
for col, term in enumerate(terms):
    data.append( (term, sums[0,col] ))

ranking = pd.DataFrame(data, columns=['term','rank'])
print(ranking.sort_values('rank', ascending=False))

编程相关推荐

java在BFS中创建接受用户输入的树
chef:：Exception:：RecipeNotFound找不到cookbook java的配方默认值
java for循环算法不更新变量
java如何启用以cookie为条件的按钮？
maven项目中的java获取错误：FirefoxDriver无法解析为类型
瓦丁不能铸造java。util。集合$EmptySet到java。util。哈希集
java视图页面未显示从控制器传递的数据
java数据输入流是否跳过字符？
java Basic SpringMVC+Tomcat问题
java JFreeChart为时间创建自定义值轴

相关问题更多 >

编程相关推荐

热门问题

热门文章

按tfidf对TfidfVectorizer输出进行排序（从最低到最高，反之亦然）

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >