我有一个电影评论数据集,我想对它进行情绪分析
我使用逻辑回归实现了这一点。以下是我在这个过程中采取的步骤:
现在,我需要使用朴素贝叶斯实现同样的事情,我对如何处理这个问题感到困惑。我假设前4步是相同的。但是,当使用朴素贝叶斯时,训练步骤是什么?在这种情况下,损失函数和成本函数是什么?我在哪里使用贝叶斯定理来计算条件概率?如何更新权重和偏差
我在web上搜索了很多资源,我几乎只找到了使用sklearn with model.fit和model.predict的实现,我很难弄清楚这背后的数学原理,以及如何使用vanilla python实现它
在Logistic回归或支持向量机的情况下,模型试图预测最适合数据的超平面。因此,这些模型将决定
weights and biases
Naive Bayes
也是一种概率方法。这完全取决于Bayes' theoremNB中会有
NO
权重和偏差,每个特征只会有CLASS WISE
概率值(即,文本情况下为words
)为了避免零概率或处理不可见数据的情况(
words
对于文本),请使用拉普拉斯平滑α
称为平滑因子。这将是NB中的超参数使用
log
表示数值稳定性测试示例:
This movie is great
删除停止字后:
movie great
从训练数据中,我们已经知道单词
movie
和great
的prob值,这两个词都是+ve
&-ve
类。请参阅STEP 2
对于
+ve
类great
的Prob将大于对于-ve
类great
的Prob。对于单词movie
,prob值可能几乎相同。(这在很大程度上取决于你的训练数据。这里我只是做一个假设)附言
有关详细信息,请参阅sk-learn naive bayes
相关问题 更多 >
编程相关推荐