一个python包,为spark中的清理、重复数据消除、扩展等提供帮助
spark-etl-python的Python项目详细描述
spark etl python
一个python包,为spark中的清理、重复数据消除、充实等提供帮助
- 自由软件:麻省理工学院许可证
- 文档:https://spark-etl-python.readthedocs.io。
功能
- 待办事项
发展
为了能够在此软件包上开发:
- 创建虚拟环境
- 安装pip工具:pip安装pip工具
- 运行pip sync requirements\u dev.txt requirements.txt
要更新依赖项,请将它们添加到requirements.in(如果运行包需要它们)或requirements.in。 然后运行pip compile requirements.in或pip compile requirements.in。
学分
这个包是用Cookiecutter和audreyr/cookiecutter-pypackage项目模板创建的。
历史记录
0.1.0(2018-10-19)
- pypi上的第一个版本。