具有快速插入和追加功能的python数据帧
raccoon的Python项目详细描述
具有快速插入和追加功能的python数据帧
概述
浣熊是一个轻量级的数据框架和系列实现,灵感来源于非凡的熊猫包 已知pandas是次优的情况:在代码中经常按行增长的数据帧。另外 浣熊数据帧可以参数化以进行排序,这样添加到数据帧中的内容可以使索引保持排序顺序 加快插入和检索速度。
灵感
pandas数据框架是用于数据管理和分析的优秀多用途数据结构。其中一个用例 我不得不使用dataframes作为内存数据库表的一种类型。问题是这需要大量的增长 数据帧的行,这在熊猫中是很慢的。在大熊猫身上生长缓慢的原因是 底层数据结构是numpy,它在数组大小增加时完成数据的完整复制。
功能性
raccoon实现了将dataframe用作索引和列数据结构的内存存储所需的功能。 支持简单索引和元组索引来模拟熊猫的层次索引。包括的方法主要是 关于设置数据帧的值、增长和附加数据帧以及从数据帧获取值。 浣熊数据框不适用于熊猫等数学运算,只包含有限的基本数学方法。
为什么是浣熊?
根据维基百科,一些科学家认为熊猫与浣熊有关。
未来
这个包满足了它最初创建的需求。我自己将来的任何补充都将由我自己来推动 需要,但它是完全开源的,我鼓励任何人添加和扩展。
我希望有一天pandas能解决数据帧增长带来的速度问题,而这个包将变得过时。