关于评论摘要的NLP项目

2024-06-16 12:03:19 发布

您现在位置:Python中文网/ 问答频道 /正文

我计划做最后一年的自然语言处理项目(使用NLTK),我感兴趣的领域是来自社交媒体网站(如Facebook)的评论摘要。例如,我正在尝试这样做:

图片中随机的Facebook评论:

  1. 哇!美丽的。在
  2. 看上去真漂亮。在
  3. 非常漂亮,漂亮的照片。在

现在,所有这些注释都将被映射(使用基于模板的注释摘要技术)到如下所示:

三个人觉得这幅画很“漂亮”。

输出将由单词“beautiful”组成,因为它在注释中比单词“pretty”使用得更为普遍(而且beauty和pretty是同义词),我将使用跟踪关键字频率关键字得分(在这种情况下,“美丽”“漂亮”的得分非常接近)。 这是最好的方法吗?

到目前为止,在我的研究中,我已经提出了以下论文,但没有一篇论文涉及到这种评论摘要:

在这一领域,还有哪些论文涉及类似的问题?在

除此之外,我还希望我的摘要生成器能够随着每次摘要的进行而改进任务。怎么做我在这方面是否应用了机器学习?在


Tags: 项目facebook网站pretty评论social关键字单词
1条回答
网友
1楼 · 发布于 2024-06-16 12:03:19

主题模型聚类就是你要找的。在

在Google学者搜索“主题模型聚类”会给你很多关于主题模型聚类的参考。在

要理解它们,除了一般的机器学习基础知识外,您还需要熟悉以下任务的方法。在

  1. 聚类:余弦距离聚类,k均值聚类
  2. 排名:PageRank,TF-IDF,互信息增益,最大边际相关

相关问题 更多 >