我有一个包含多个工作簿的excel spreedsheet,每个工作簿都有以下属性:
data = pd.DataFrame({
'start date': ['1988/01/12', '1988/01/13', '1988/01/14', '1989/01/20','1990/01/01'],
'end date': ['1989/01/12', '1989/01/12', '1989/01/12', '1990/01/20','1991/01/01'],
'value': [11558522, 12323552, NaN, 18412280, NaN]
})
我想循环浏览工作簿中的每张工作表,并:
我想要一个摘要spreedsheet/dataframe,其中包含sheetname(id)、开始日期、结束日期和缺少的值的数量,如下所示:
data = pd.DataFrame({
sheet name': ['sheet 1', 'sheet 2', 'sheet 3', 'sheet 4','sheet5'],
'start date': ['1988/01/12', '1988/01/13', '1988/01/14', '1989/01/20','1990/01/01'],
'end date': ['1989/01/12', '1989/01/12', '1989/01/12', '1990/01/20','1991/01/01'],
'missing values': [3, 10, 1, 43, 8]
})
对所有工作表使用^{} 中的} 创建的掩码的
sheet_name
来对数据帧进行排序,将列转换为日期时间,并通过^{sum
,最后附加到列表,最后通过构造函数创建新的DataFrame
来获得最小和最大的misng值,并计数misng值的数量:相关问题 更多 >
编程相关推荐