TextBlob NaiveBayesAnalyzer非常慢(与模式相比)

2024-10-05 19:39:23 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用TextBlob for python对tweets进行一些情绪分析。TextBlob中的默认分析器是PatternAnalyzer,它工作得非常好,速度也相当快。在

sent = TextBlob(tweet.decode('utf-8')).sentiment

我现在尝试切换到NaiveBayesAnalyzer,发现运行时不适合我的需要。(每个tweet接近5秒。)

^{pr2}$

我以前使用过naivebayes分类器的scikit-learn实现,但没有发现它有这么慢,所以我想知道我是否正确地使用了它。在

我假设分析器是预先训练过的,至少dataset%20of%20movie%20reviews." rel="nofollow">the documentation声明“naivebayesanalyzer是在电影评论数据集上训练的。”但是它还有一个函数train(),它被描述为“在电影评论语料库上训练naivebayes分类器”。它是否在每次运行前对分析器进行内部训练?我希望不会。在

有人知道加快速度的方法吗?在


Tags: 分析器for电影分类器评论速度tweetsutf
1条回答
网友
1楼 · 发布于 2024-10-05 19:39:23

是的,Textblob将在每次运行前训练分析仪。您可以使用以下代码来避免每次都训练分析器。在

from textblob import Blobber
from textblob.sentiments import NaiveBayesAnalyzer
tb = Blobber(analyzer=NaiveBayesAnalyzer())

print tb("sentence you want to test")

相关问题 更多 >