擅长:python、mysql、java
<p>草草一看,有些东西就会蹦出来,
1) 在不了解tb方法是如何实现的情况下,您似乎在为每个单词调用<code>tb(blob)</code>。{cd1>每一个对象返回一次。
2) <code>nltk</code>有自己的<code>tfidf</code>实现,这将更加优化,并且可以加快速度。
3) 您可以使用<code>numpy</code>而不是普通的python来实现,这肯定会加快速度向上。但是即使这样,最好缓存结果并使用它们,而不是多次调用一个可能很重的函数。在</p>