<p>我正在使用Gensim的木槌包装器进行主题建模-</p>
<pre><code>LdaMallet(path_to_mallet_binary, corpus=corpus, num_topics=100, id2word=words, workers=6, random_seed=2)
</code></pre>
<p>虽然上面的工作速度惊人地快,但获取每个文档(n=40000)的主题分布的步骤(见下文)需要很长时间</p>
<pre><code>#Store topic distributuon for all documents
all_topics=[]
for x in tqdm(range(0, len(doc_list))):
all_topics.append(lda_model[corpus[x]])
</code></pre>
<p>完成30000份文件大约需要18个小时。我不确定我做错了什么。有没有一种方法可以更快地分发所有文档的主题</p>