<p>我想打印文件夹中文本文件列表的三元组频率。
这是我的python代码,它不打印任何内容。
有什么想法吗?在</p>
<pre><code>import nltk
import os
from nltk import trigrams
for fn in os.listdir('folder path where txt files are stored'):
if os.path.isfile(fn):
infile = open(fn,"r")
for line in infile:
tokens = nltk.word_tokenize(line)
tokens = [token.lower() for token in tokens if len(token) > 1]
tri_tokens = trigrams(tokens)
print [(item, tri_tokens.count(item)) for item in sorted(set(tri_tokens))]
</code></pre>