用朴素贝叶斯方法求TF/Count向量

2024-09-25 06:32:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用的是python3.7(Windows,64位)。虽然我可以得到TF-IDF结果,但我不能得到TF/计数向量之后。这是我得到TF-IDF结果的示例代码

DOC, LBL = read_corpus()

# Splits the dataset into training (75%) and test set(25%)
split_point = int(0.75*len(DOC))
trainDoc = DOC[:split_point]
trainClass = LBL[:split_point]
testDoc = DOC[split_point:]
testClass = LBL[split_point:]

# Calling the classifier (use the tf-idf/count feature/vectorizer)
Multinomial_Naive_Bayes(trainDoc, trainClass, testDoc, testClass, tfIdf=True)

Tags: the示例docwindowstf向量point计数
1条回答
网友
1楼 · 发布于 2024-09-25 06:32:45

在google搜索之后,我找不到任何包含Multinomial_Naive_Bayes()方法的库

您可能需要编辑您的问题并在此处粘贴您自己的方法,如Multinomial_Naive_Bayes()read_corpus()

但是,如果您使用的是scikit learn,您可以这样做:

vectorizer = CountVectorizer()
transformer = TfidfTransformer()
word_freq_matrix = vectorizer.fit_transform(corpus)
tfidf_result = transformer.fit_transform(word_freq_matrix)

相关问题 更多 >