奶酪饼:数据科学的工具箱
cheesebread的Python项目详细描述
cheesebread是一个数据工具箱。换句话说,它支持 将数据从restapi获取到数据集中,而无需显式处理 中间的每一步。在
cheesebread句柄:
- data catalog and datasets
- asynchronous communication to REST APIs
- aggregate data into time series from REST APIs
- authentication
- expiring tokens
- request limits and retry on failure
- deduplication
基本原理
通常,从restapi收集数据会妨碍数据分析和 机器学习。工具箱实现自动数据收集的助手列表。在
此外,当我们得到聚合数据时,例如,一个API端点 返回用户在给定时间段内的交互次数,工具箱将设法创建 时间序列通过异步调用API多次-有点老套,但它会得到我们需要的。在
工具箱的目标是一个有点初出茅庐的数据科学团队,他们的主要工作是 从数据分析开始,而不是数据收集。在
版本控制
总是建议改版。我们使用Semantic Versioning。在
给定版本号主要.次要.修补,递增:
- 当您更改不兼容的API时
- 以向后兼容的方式添加功能时的次要版本,以及
- 当你做向后兼容的错误修复时的补丁版本。在
许可证
版权所有(C)2020 Gabriel Stefanini Vicente。cheesebread是一种自由软件:您可以根据自由软件基金会发布的GNU通用公共许可证的条款重新发布和/或修改它,可以是该许可证的第3版,也可以是任何更高版本(由您选择)。本程序的发布是希望它能有用,但没有任何保证;甚至没有对适销性或特定用途适用性的暗示保证。有关更多详细信息,请参阅GNU通用公共许可证。您应该已经收到了GNU通用公共许可证的副本以及此程序。如果没有,请参见http://www.gnu.org/licenses/。在
- 项目
标签: