我使用TextBlob for python对tweets进行一些情绪分析。TextBlob中的默认分析器是PatternAnalyzer,它工作得非常好,速度也相当快。在
sent = TextBlob(tweet.decode('utf-8')).sentiment
我现在尝试切换到NaiveBayesAnalyzer,发现运行时不适合我的需要。(每个tweet接近5秒。)
^{pr2}$我以前使用过naivebayes分类器的scikit-learn实现,但没有发现它有这么慢,所以我想知道我是否正确地使用了它。在
我假设分析器是预先训练过的,至少dataset%20of%20movie%20reviews." rel="nofollow">the documentation声明“naivebayesanalyzer是在电影评论数据集上训练的。”但是它还有一个函数train(),它被描述为“在电影评论语料库上训练naivebayes分类器”。它是否在每次运行前对分析器进行内部训练?我希望不会。在
有人知道加快速度的方法吗?在
是的,Textblob将在每次运行前训练分析仪。您可以使用以下代码来避免每次都训练分析器。在
相关问题 更多 >
编程相关推荐