擅长:python、mysql、java
<p>如果<code>urls.find():</code>找到集合中的所有文档并对其进行循环,那么随着集合的增大,它不可避免地会减慢速度。你知道吗</p>
<p>当你看到并创建了必要的文章时,你能用已处理的<code>true</code>标记你的已处理文档的url吗?这样,您就可以改为<code>urls.find({processed: {$ne: true}})</code>只查找需要处理的url。使用此方案,您希望在url集合的<code>{processed: 1}</code>上有一个索引,在posts集合的<code>{url: 1}</code>上有一个索引。你知道吗</p>