用于任何数据源的基于python的scraper。

pyetl-framework的Python项目详细描述


#pyetl框架
用于构建和运行etl管道的基于烧瓶的框架

创建一个新的python项目,然后“pip install pyetl framework”。

要运行app flask应用程序前端:`pyetl flask`
要运行工作进程:`pyetl flask worker`

app_basedir=$(pwd)必须指向包含配置文件的目录。还需要配置文件。请参见“config.py.example”。

` pipe.start()`应该执行任何必要的操作,确定并将必须执行的任何和所有“etljob”排队,以便认为运行成功。


\etljob
框架中定义的基类。它有三种方法:提取、转换、加载。

etljob将在执行时运行{transformer extractor loader}.execute()'。

要开始使用,请点击[此处](https://realpython.com/blog/python/flask-by-example-part-1-project-setup)。


once


then:`pip install-r requirements.txt`

这不应该在这里。
git remote add heroku staging git@heroku.com:pyscrap staging.git
git remote add heroku production git@heroku.com:pyscrap production.git

`make deploy`

release
首先,创建一个新的pip包。这将碰撞修补程序版本并将其写入“version”。
“make package”

然后,将包推送到存储库:
“make release”`

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何在springmvc POST webservice中验证集合?   java将变量传递到@Optional注释   浮点Java字节到浮点   java为什么我的结果字符串在解析json数据后不打印到logcat?   多线程应用程序中的java可选调试输出是为客户机提供的,而不是为了找出死锁或bug   java Hibernate模型对象作为VO对象   java字体未应用于复选框并切换到Android Studio 3   list Java equals方法无法按预期工作   java将未知对象强制转换为特定接口可以吗?   调用后未擦除方法中的Java变量   数组求和不正确,线程“main”java中出现异常。lang.ArrayIndexOutofBounds异常:100   java超级类应该实例化并调用其子类吗?   在java apache中。平民io,如何避免读取旧的日志消息   BuffereImage如何使用apache在TIFF图像中保持透明性。平民java中的图像处理   java转换。将文件分类为二进制代码(1和0)   Java:。类搜索器   java如何使用谓词生成器返回“Todays Orders”