Parselab帮助程序模块
parselab的Python项目详细描述
分析实验室
这个包包含有助于用Python编写解析器的类。在
使用
要使用parelab
,只需创建一个从BasicParser
派生的类。在
fromparselab.cacheimportFileCachefromparselab.networkimportNetworkManagerfromparselab.parsingimportBasicParserclassMyParser(BasicParser):def__init__(self):self.cache=FileCache(namespace='my-parser',path=os.environ.get('CACHE_PATH'))self.net=NetworkManager()db.connect(os.environ['PARSINGDB'])db.setup_project('my-project')
之后,您将能够使用BasicParser.get_page()
方法下载页面:
BasicParser
将使用__init__
方法中指定的网络管理器并将保存所有
已将页面下载到$CACHE_PATH
环境变量指定的目录中。
下次调用get_page()
方法时,它将从缓存中获取请求的页面
如果有的话。在
- 项目
标签: