擅长:python、mysql、java
<p>给定一个单词列表的语料库,你要做的就是创建一个Gensim字典,把你的语料库改成单词包,然后创建你的矩阵:</p>
<pre><code>from gensim.matutils import corpus2csc
from gensim.corpora import Dictionary
# somehow create your corpus
dct = Dictionary(corpus)
bow_corpus = [dct.doc2bow(line) for line in corpus]
term_doc_mat = corpus2csc(bow_corpus)
</code></pre>
<p>您的<code>term_doc_mat</code>是一个Numpy压缩稀疏矩阵。如果你想要一个术语矩阵,你可以用它的转置来乘以它,即:</p>
^{pr2}$