多个订阅源聚合

2024-07-02 11:00:09 发布

您现在位置:Python中文网/ 问答频道 /正文

在universalfeedparser中处理单源提要解析非常幸运,但是现在我需要运行多个feed并生成按时间顺序交错的输出(而不是RSS)。似乎我需要遍历url并将每个条目填充到字典列表中,然后根据条目时间戳对其进行排序,然后从顶部切下一部分。这似乎是可行的,但在资源方面相当昂贵(为此,我会积极地缓存它)。在

只是想知道是否有更简单的方法-例如,一个与feedparser一起工作的现有库来进行简单的聚合。样本代码?有问题还是警告?谢谢。在


Tags: 方法url列表字典排序顺序feed时间
2条回答

您可以将提要放入数据库,然后从该数据库生成新的提要。在

考虑研究两个基于feedparser的RSS聚合器:Planet Feed Aggregator和{a2}(基于Django),或者至少它们是如何解决这个问题的。在

这里已经建议在数据库中存储数据,例如bsddb.btopen()或任何RDBMS。在

看一看heapq.merge()bisect.insort(),如果您想合并内存中的数据,可以使用其中一个B树实现。在

相关问题 更多 >