我正在使用熊猫管道为tf-idf工作。我使用的是来自SMART符号的lnc.ltc
加权方案。你知道吗
query = 'some string'
pipeline = Pipeline([
('vect', CountVectorizer(stop_words='english')),
('tfidf', TfidfTransformer(norm='l2', use_idf=False, smooth_idf=False, sublinear_tf=True)),
])
doc_vectors = pipeline.fit_transform(data).toarray()
query_vector = pipeline.transform([query]).toarray()
对于文档向量,我想设置use_idf=False
,这样就完成了。但是如何为查询向量设置use_idf=True
?
我试图直接更改use_idf
参数,但它不起作用。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐