有 Java 编程相关的问题?

你可以在下面搜索框中键入要查询的问题!

主题建模malletjava:获取文档集合的概率分布

我想得到一个文档集合的单一概率分布,因为我需要能够使用KL散度,这可能吗

在本例中:http://mallet.cs.umass.edu/topics-devel.php 使用getTopicProbabilities()方法 我得到了每个实例的概率分布,但是如果我想得到一个文档集合的单一分布

这可能是文件的主题分发吗

  TopicInferencer inferencer = model.getInferencer();
  double[] testProbabilities = inferencer.getSampledDistribution(testing.get(0), 10, 1, 5);

共 (1) 个答案

  1. # 1 楼答案

    我认为我们可以对文档集的每个主题概率进行一些平均。但这只有在文件相似时才有意义。也许你可以根据相似性阈值和这些文档的平均值对文档进行聚类