我想研究使用NLP来检测负面/非建设性评论,即那些经常出现在网上讨论政治的评论。我很想知道如果给我这样一句话:
You're a liberal dweeb. Clinton is ruining the US with her inappropriate behavior as president.
是否不仅可以使用NER推断实体(你,克林顿),还可以得到关于每个实体的陈述树:
+-----------------+ +------------------------+
| | | |
| | | |
| you | | Clinton |
| +------+ | +------+
| | | | | |
+--+--------------+ | | | |
| | +--+---------------------+ |
| | | |
| | | |
+-+-------+ +----+-----+ | +---------+----------+
| | | | +----+---------+ | |
| | | dweeb | | | | |
| liberal| | | | ruining US | | has inappropriate |
| | +----------+ | | | behavior as pres. |
+---------+ | | | |
+--------------+ +--------------------+
NLP有这种可能吗?你知道吗
是的,你所寻找的是肯定有可能与NLP。有两种方法你应该进一步研究。你知道吗
1)在编码方面,更快的方法是使用NLP框架(如Stanford NLP、Spacy等)的“关系提取器”功能,但需要在标记和培训带注释的数据方面进行投资。但是,您必须对默认模型进行一些定制和培训。这里有一篇link到一篇关于使用NLTK实现这一点的示例博客文章,但是如果您采用这种方法,您应该寻找一篇更新的文章。你知道吗
2)@Gabriel提到了在编码方面比较慢但不需要数据标签和注释的方法,在语句上运行依赖关系解析器和实体管道,然后在代码中使用一组手动规则来提取关系。你知道吗
选区解析器或依赖关系解析器,可能加上某种语义分析,为您提供有关命名实体和非命名实体的更多信息,可能就是您要寻找的。尝试将一些例句粘贴到http://corenlp.run/或http://demo.ark.cs.cmu.edu/parse中,后者应用依赖关系分析和语义分析,以查看它是否是您要查找的类型。你知道吗
相关问题 更多 >
编程相关推荐