我计划做最后一年的自然语言处理项目(使用NLTK),我感兴趣的领域是来自社交媒体网站(如Facebook)的评论摘要。例如,我正在尝试这样做:
图片中随机的Facebook评论:
现在,所有这些注释都将被映射(使用基于模板的注释摘要技术)到如下所示:
三个人觉得这幅画很“漂亮”。
输出将由单词“beautiful”组成,因为它在注释中比单词“pretty”使用得更为普遍(而且beauty和pretty是同义词),我将使用跟踪关键字频率和关键字得分(在这种情况下,“美丽”和“漂亮”的得分非常接近)。 这是最好的方法吗?
到目前为止,在我的研究中,我已经提出了以下论文,但没有一篇论文涉及到这种评论摘要:
在这一领域,还有哪些论文涉及类似的问题?在
除此之外,我还希望我的摘要生成器能够随着每次摘要的进行而改进任务。怎么做我在这方面是否应用了机器学习?在
主题模型聚类就是你要找的。在
在Google学者搜索“主题模型聚类”会给你很多关于主题模型聚类的参考。在
要理解它们,除了一般的机器学习基础知识外,您还需要熟悉以下任务的方法。在
相关问题 更多 >
编程相关推荐