我正在使用scikit学习创建tf-idf。所以,下面是我所做工作的摘录:
def create\u tm(内容):
vectorizer = CountVectorizer(stop_words=stopWords,min_df=1)
transformer = TfidfTransformer()
tdm = vectorizer.fit_transform(content)
trainVectorizerArray = tdm.toarray()
X_tfidf = transformer.fit_transform(trainVectorizerArray)
Dict = vectorizer.vocabulary_
return (tdm, X_tfidf, Dict)
我的问题是——是否可以强制矩阵索引值从1开始,而不是从0开始?你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐