Pandas组合Excel电子表格

2024-09-27 07:20:20 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个带很多标签的Excel工作簿。 每个选项卡与所有其他选项卡具有相同的标题集。 我想将每个选项卡中的所有数据合并到一个数据框中(不重复每个选项卡的标题)。

到目前为止,我试过:

import pandas as pd
xl = pd.ExcelFile('file.xlsx')
df = xl.parse()

是否可以使用表示“所有电子表格”的解析参数? 还是这是错误的做法?

提前谢谢!

更新:我尝试了:

a=xl.sheet_names
b = pd.DataFrame()
for i in a:
    b.append(xl.parse(i))
b

但这不是“工作”。


Tags: 数据import标题pandasdfparseas标签
1条回答
网友
1楼 · 发布于 2024-09-27 07:20:20

这是一种方法——将所有工作表加载到数据帧字典中,然后将字典中的所有值连接到一个数据帧中。

import pandas as pd

将sheetname设置为None以便将所有工作表加载到数据帧的dict中 忽略索引以避免以后出现重叠值(请参见@bunji的注释)

df = pd.read_excel('tmp.xlsx', sheetname=None, ignore_index=True)

然后连接所有数据帧

cdf = pd.concat(df.values())

print(cdf)

相关问题 更多 >

    热门问题