我创建了一个朴素贝叶斯分类器,它使用不同政客的推文文本来预测他们的政党。我使用了sklearnMultinomialNB
实现。以下是我的实现:
Senators_Vectorizer = CountVectorizer(decode_error= 'replace')
senator_counts = Senators_Vectorizer.fit_transform(senator_tweets['text'].values)
senator_targets = senator_tweets['party'].values
senator_counts_train, senator_counts_test, senator_targets_train, senator_targets_test = train_test_split(senator_counts, senator_targets, test_size = .1)
senator_party_clf = MultinomialNB()
senator_party_clf.fit(senator_counts_train, senator_targets_train)
如何找到朴素贝叶斯分类器用于预测的单词?有没有办法找到民主党/共和党推文中出现概率最高的词
我想要的是Senators_Vectorizer
中每个单词的概率,而不是特定推文来自特定方的概率
使用
feature_log_prob_
/coef_
属性获取每个特征的概率From Documentation:
This我想教程会有所帮助
获取每个类的顶级功能的快速示例:
输出:
相关问题 更多 >
编程相关推荐