Tablib将数据本分解成数据集

2024-06-26 14:31:02 发布

您现在位置:Python中文网/ 问答频道 /正文

我已经成功地将一个Excel文件导入tablib作为一个数据手册。在

imported_data = tablib.Databook().load('xlsx',open('file.xlsx', 'rb').read())

既然我已经导入了它,我似乎对数据本无能为力。我想我需要得到一个数据集(相当于一个Excel工作表),但我不能想出如何解开数据手册(或者更好的是,提取一个特定的工作表作为数据集)。在

Python2.7。在

Tablib引用:http://docs.python-tablib.org/en/latest/api/#tablib.Databook

^{pr2}$

一旦我有了数据集,我就可以开始工作了。 有人知道怎么做吗?在


Tags: 文件数据readdataload手册openxlsx
2条回答

这是我唯一能让名字和数据正确输出的方法。
通过事先声明它是一个数据手册,以及导入的文件类型,我可以访问数据集的标题和每个数据集中的所有数据。在

imported_data = tablib.Databook()  # declare the databook first
imported_data.xlsx = open(import_filename, 'rb').read()  

for dataset in imported_data.sheets():
    print(dataset.title)  # returns all the sheet title names
    print(dataset)  # returns the data in each sheet

不知何故,我才刚刚开始使用tablib。无论如何,我在使用数据库时遇到了这个问题。毫无疑问,这不再是一个紧迫的问题,但是对于其他人来说,Databook.sheets方法返回一个Dataset对象的列表:

In [2]: databook = tablib.Databook().load('xlsx', open('file.xlsx', 'rb').read())

In [3]: databook.sheets()
Out[3]: [<sheet1 dataset>, <sheet2 dataset>, <sheet3 dataset>]

相关问题 更多 >