<p>这是我的代码的简单版本。在</p>
<pre><code> for i in range(len(holdList)):
foundTerm = re.findall(r"\b" + self._searchTerm +
r"\b", holdList[i][5], flags=re.IGNORECASE)
# count the occurrence
storyLen = len(foundTerm)
holdList[i] += (storyLen,)
if foundTerm:
# Stores each found word as a list of strings
# etc
holdList[i] += (self.sentences_to_quote(holdList[i][5]), )
</code></pre>
<p>在循环过程中(最后一行),我调用一个不同的方法来查看每个句子,它返回包含单词的句子。holdList是来自MySQL查询的元组。在</p>
^{pr2}$
<p>我该怎么做才能加快速度?我能做些什么吗?程序正在处理10MB的文本。通过分析,我发现这两个方面是瓶颈。我希望我提供了足够的信息来说明这一点。在</p>