擅长:python、mysql、java
<p>下面是一个可以在python中创建的函数,用于获取最常用的单词:</p>
<pre><code>def generatedfwordfreq(topicnumber, numwords):
topic = sorted(mgp.cluster_word_distribution[topicnumber].items(),
key=lambda k: k[1], reverse=True)[:numwords]
dfm = pd.DataFrame(topic)
dfm = dfm.rename(columns={0: 'Word', 1: 'Freq'})
return dfm
</code></pre>
<p>上面返回一个数据帧,其中包含最前面的“numwords”单词的单词和频率;numwords是最常用字数的整数。请注意,mgp将主题编号存储为整数(1,2,3…),因此可以通过调用mgp.cluster\u word\u distribution[topicnumber]将其用作“topicnumber”来引用特定主题</p>