代码的最后部分:
lda = LdaModel(corpus=corpus,id2word=dictionary, num_topics=2)
print lda
bash输出:
INFO : adding document #0 to Dictionary(0 unique tokens)
INFO : built Dictionary(18 unique tokens) from 5 documents (total 20 corpus positions)
INFO : using serial LDA version on this node
INFO : running online LDA training, 2 topics, 1 passes over the supplied corpus of 5 documents, updating model once every 5 documents
WARNING : too few updates, training might not converge; consider increasing the number of passes to improve accuracy
INFO : PROGRESS: iteration 0, at document #5/5
INFO : 2/5 documents converged within 50 iterations
INFO : topic #0: 0.079*cute + 0.076*broccoli + 0.070*adopted + 0.069*yesterday + 0.069*eat + 0.069*sister + 0.068*kitten + 0.068*kittens + 0.067*bananas + 0.067*chinchillas
INFO : topic #1: 0.082*broccoli + 0.079*cute + 0.071*piece + 0.070*munching + 0.069*spinach + 0.068*hamster + 0.068*ate + 0.067*banana + 0.066*breakfast + 0.066*smoothie
INFO : topic diff=0.470477, rho=1.000000
<gensim.models.ldamodel.LdaModel object at 0x10f1f4050>
所以我想知道我是否能够将生成的主题保存为可读的格式。我试过.save()
方法,但它总是输出一些不可读的东西。
以下是如何保存gensim LDA的模型:
要打印主题,有以下几种方法:
您只需要使用
lda.show_topics(topics=-1)
或任何数量的主题(topics=10,topics=15,topics=1000….)。我通常只是:所有这些参数和其他参数都可以在gensimdocumentation中找到。
您可以使用
pickle
模块。相关问题 更多 >
编程相关推荐