熊猫的更轻版本。没有序列,没有层次索引,只有一个索引器[]
pandas-lite的Python项目详细描述
熊猫石
比熊猫更简单的选择
主要目标
- 一组非常少的功能
- 尽可能明确
- 应该有一个——最好只有一个——显而易见的方法。
数据结构
- 仅数据帧
- 无系列
数据类型
- 仅基元类型-int、float、boolean、numpy.unicode
- 没有对象数据类型
行和列标签
- 没有索引,表示没有行标签
- 没有层次索引
- 列名必须是字符串
- 列名必须唯一
- 存储在numpy数组中的列
子集选择
- 只有一种选择数据的方法-[ ]
- 子集选择将是显式的,并且需要行和 列
- 将仅按整数位置选择行
- 列将由标签或整数位置选择。自从 列必须是字符串,这不会是错误的
- 列名不能重复
所有选择和操作复制
- 所有选择和操作都会提供数据的新副本 <>这将避免任何链式索引混淆
发展
- 必须使用类型提示
- 必须使用3.6-f字符串
- 必须有numpy、瓶颈、numexpr
小功能集
- 尽可能少地实现属性和方法
- 把重点放在好的习惯性食谱例子上 任务
仅标量数据类型
没有复杂的python数据类型-[x]bool-总是8位,不为空-[x] int-总是64位,不为空-[x]浮点-总是64位,为空 允许-[x]str-一个python unicode对象,允许为空-[] 分类-[]日期时间-[]时间增量
要实现的属性
- [X]尺寸
- [X]形状
- [X]值
- [X]数据类型
不能将任何二进制运算符实现为方法(add、sub、mul, 等……)
方法
stats-[x]abs-[x]all-[x]any-[x]argmax-[x]argmin-[x] 剪辑-[]更正-[X]计数-[]cov-[X]cummax-[X]cummin-[] cumprod-[x]cumsum-[]描述-[x]最大-[x]最小-[x]中值- [X]平均值-[]模式-[]最大-[]最小-[]分位数-[] 等级-[X]标准-[X]总和-[X]变量-[]唯一-[]非唯一
选择-[]删除-[]删除重复项-[x]头-[]isin- []示例-[X]选择数据类型-[X]尾-[]其中
缺少数据-[]isna-[]dropna-[]fillna-[]interpolate
其他-[]附加-[]应用-[]分配-[x]astype-[] Groupby-[]信息-[]融化-[]内存使用-[]合并-[] 数据透视-[]替换-[]滚动-[]排序值
函数-[]读取csv-[]读取sql-[]连接