学习变换和变换行为

2024-09-28 22:18:07 发布

您现在位置:Python中文网/ 问答频道 /正文

fit_transformtransform方法的测试感到困惑

我有一个语料库,是字符串列表

corpus = ['sentence 1',...]

from sklearn.feature_extraction.text import TfidfVectorizer

Vec = TfidfVectorizer()

X_tfidf1 = Vec.fit_transform(corpus)
X_tfidf2 = Vec.transform(corpus)

但是:

np.array_equal(X_tfidf1.todense(),X_tfidf2.todense())返回False,这对我来说没有意义,因为Vec是在我的语料库上拟合的,两个TFIDF矩阵不应该是相同的吗


Tags: 方法字符串from列表transformcorpussklearnsentence