<p>在客户评论的短文本上进行主题建模。已经使用GSDMM-Movie group流程将评论分为20个主题</p>
<pre><code>mgp = MovieGroupProcess(K=20, alpha=0.01, beta=0.1, n_iters=30)
vocab = set(x for doc in docs for x in doc)
n_terms = len(vocab)
n_docs = len(docs)
# Fit the model on the data given the chosen seeds
y = mgp.fit(docs, n_terms)
</code></pre>
<p>我能够得到每个评论旁边的主题结果,如“主题1”、“主题2”。。诸如此类。如何获得每个主题下的热门单词列表?任何帮助都将不胜感激</p>