擅长:python、mysql、java
<p>像其他人一样,我不确定我是否有足够的背景来提供全面的信息。但这句话:</p>
<pre><code>counter.form[token][file_name] += 1
</code></pre>
<p>告诉我,<code>counter.form</code>将为每个令牌/文件名组合包含一个单独的计数。这是由你所说的计数器初始化所支持的:</p>
^{pr2}$
<p>也就是说,<code>self.form</code>是一个默认字典,它的默认值是<code>collection.Counter</code>的实例(基本上是{<cd4>},还有一些额外的方法,IIRC)。所以,基本上,一个二维计数器。在</p>
<p>如果您希望令牌的计数,而不管它们在哪个文件中,那么您基本上不希望<code>file_name</code>作为计数器的参数,并且计数器必须是一维的。所以我想把计数器的初始化改为:</p>
<pre><code>self.form = collections.Counter()
</code></pre>
<p>并将计数递增为:</p>
<pre><code>counter.form[token] += 1
</code></pre>
<p>根据程序其余部分的结构,您可能需要更多的更改。但希望这能让你朝着正确的方向前进。在</p>