擅长:python、mysql、java
<p>我看到你在用这个例子,看到了和你看到的一样的东西,为了让它正常工作,你必须用空格分开字符串。如果你不这样做,它似乎计数每个字符,这是你看到的。这将返回每个单词的正确计数,而不是字符。</p>
<pre><code>import nltk
text1 = 'hello he heloo hello hi '
text1 = text1.split(' ')
fdist1 = nltk.FreqDist(text1)
print (fdist1.most_common(50))
</code></pre>
<p>如果要读取文件并获取字数,可以这样做:</p>
<h3>input.txt</h3>
<pre><code>hello he heloo hello hi
my username is heinst
your username is frooty
</code></pre>
<h3>python代码</h3>
<pre><code>import nltk
with open ("input.txt", "r") as myfile:
data=myfile.read().replace('\n', ' ')
data = data.split(' ')
fdist1 = nltk.FreqDist(data)
print (fdist1.most_common(50))
</code></pre>