问题:我想遍历Excel文件并提取特定值并保存到数据帧中。在
为什么:这有助于QA流程,通过循环,我可以将所有报表拉到文件夹中,并快速保存关键数据点。当前的过程包括打开每个文件,将某些单元格复制并粘贴到“主QA”xlsx文件中
它们都有两个数据点Date
和{
我们可以使用openpyxl
打印每个文件的每个数据点
import os
import openpyxl
import pandas as pd
path=r"C:\Users\Desktop\StackOverflow"
os.chdir(path)
for resi_files in os.listdir(path):
if os.path.isfile(resi_files):
myworkbook=openpyxl.load_workbook(resi_files)
worksheet= myworkbook['Sheet1']
print(resi_files)
print("Date")
print(worksheet.cell(4, 2).value)
print("count")
print(worksheet.cell(4, 3).value)
这将为我们提供以下输出:
但是!这对我们没有任何好处,我们希望能够比较不同的单元值以用于QA目的。所以我们需要将这些值保存到一个数据帧中。在
要保存到数据帧必须执行以下操作:
通过打印
merged
,我们看到了一个更容易处理的数据帧。在查理·克拉克上面提到的解决方案并不是我所需要的。我需要抓取特定的单元格,因为我使用的Excel文档是用很多空单元格格式化的。但是,如果您有更好的格式Excel表,这是一个值解决方案。下面是根据查理的建议编辑的代码
这将为我们提供上述特定情况下的输出:
相关问题 更多 >
编程相关推荐