为inspire-hep提供feeds的scrapy项目(http://inspirehep.net)。
hepcrawl的Python项目详细描述
hepcrawl是一个基于inspire-hep的scrapy(http://scrapy.org)的收获库 (http://inspirehep.net)专注于自动和半自动检索 网站聚合的所有来源的新内容。特别是来自 高能物理领域的主要和次要出版商。
该项目目前处于开发初期。
请参见http://pythonhosted.org/hepcrawl上的完整文档