nltk NaiveBayesClassifier博客情感分析培训

2024-10-03 21:36:00 发布

您现在位置:Python中文网/ 问答频道 /正文

我从不同的博客文章中删除了关于某个特定主题的文章。我读到的大部分关于sentimenet分析的主题都是基于训练分类器,以确定它是否是一个pos/neg答案,如thread所示。 我的问题是我在哪里能找到字典,那里有情感。 例如:Nice: Positive , bad: negative。在


Tags: 答案pos主题字典分类器文章thread情感
2条回答

你要找的是情感词典。情感词典是一个单词词典,其中每个单词都有一个相应的情感分数(从非常消极到非常积极),或者就像你提到的一样,比如好的或坏的(但后者并不常见)。你可以使用一些情感词汇,比如sentiwordnet、sentistrength和AFINN等等。在这三个词汇中,你可以得到每个情感词对应的情感分数,当然,你可以简单地设置一个条件,如果一个词有相应的负分数,那么它是坏的,如果一个词是好的。 其中最容易使用的是AFINN,我建议您先从它开始。以后您可以根据您的应用程序升级到更合适的版本。 您可以找到有关AFINNhere的信息并从here下载。在

如果你还有其他问题,请告诉我。在

如果您正在处理英语文本,您可以使用与预培训模型相关联的极性分数词典。 我建议来自NLTK的Vader,因为它非常容易处理。在

from nltk.sentiment import vader
analyzer = vader.SentimentIntensityAnalyzer()
words_with_sentiments = analyzer.make_lex_dict()
len(words_with_sentiments)

输出7502个条目。在

.make_lex_dict()的输出是一个字典,其结构如下:

^{pr2}$

理论上,积极的价值观与积极的情绪相对应,而消极的价值观则与消极的情绪相对应。然后,可以将此字典用作正在解析的字符串的查找表。在

相关问题 更多 >