python中的表格数据容器和相关的便利例程
tabular的Python项目详细描述
表格数据可以很容易地用python语言的原生对象来表示,例如,通过表示数据集记录的元组列表。尽管创建起来很容易,但这种表示通常不支持重要的表格数据操作,如有效的列选择、矩阵数学或电子表格样式的操作。
tabular是一个用于处理表格数据的python模块包。它的主要对象是tabarray类,这是一个用于保存和操作表格数据的数据结构。通过将数据放入^ {STR 1 } $ Tab列阵对象,将获得比本地Python表示更灵活和更强大的数据表示。更具体地说,tabarray提供:
- 超快速过滤、选择和数值分析方法,使用方便的Matlab风格的矩阵运算语法
- 电子表格样式的操作,包括行和列操作、“排序”、“替换”、“聚合”、“透视”和“联接”
- 确定输入文件格式参数和数据类型的复杂推理算法
注意numpy用户:对象tabarray基于数值python包(NumPy)中的ndarray对象,而表格式包的构建通常与numpy接口良好。尤其是,numpy的用户可以获得tablarray的许多好处,例如电子表格样式的操作,而不必用tabarray替换他们通常的numpy对象,因为tablarray的大多数有用的功能部件都是直接在numpy ndarray和记录数组上工作的(参见relationship to NumPy)。
下载
从python包索引(pypi):http://pypi.python.org/pypi/tabular/下载tabular的最新版本。
tabular需要python 2.6或更高版本,但不能用于python 3k(因为numpy本身没有移植到py3k)。表格格式需要numpy v1.6或更高版本。任何早期版本都不起作用。
安装这些依赖项后,您只需转到终端中的表格源目录并运行命令“python setup.py install”(请参见Installing Python Modules)。
您还可以克隆我们的github存储库:https://github.com/yamins81/tabular。您可以报告错误,提出建议,提交请求请求,并从我们的github站点上跟踪rss。