擅长:python、mysql、java
<p>您可能会发现以下演示程序是获取文件词频的良好起点:</p>
<pre><code>#! /usr/bin/env python3
import collections
import pathlib
import pprint
import re
import sys
def main():
freq = get_freq(sys.argv[0])
pprint.pprint(freq)
def get_freq(path):
if isinstance(path, str):
path = pathlib.Path(path)
return collections.Counter(
match.group() for match in re.finditer(r'\b\w+\b', path.open().read())
)
if __name__ == '__main__':
main()
</code></pre>
<p>特别是,您需要使用<code>get_freq</code>函数来获得一个<code>Counter</code>对象,它告诉您单词的频率是什么。您的程序可以使用不同的文件名多次调用<code>get_freq</code>函数,您应该会发现<code>Counter</code>对象与您以前使用的词典非常相似。在</p>