根据文件nam将多个.xlsx文件从一个目录读入单独的Pandas数据帧

网友

1楼 · 编辑于 2024-09-30 14:22:47

我会把它们解析成DataFrame的字典：

import os
import glob
import pandas as pd

files = glob.glob('/path/to/*.xlsx')
dfs = {}

for f in files:
    dfs[os.path.splitext(os.path.basename(f))[0]] = pd.read_excel(f)

然后您可以将它们作为普通字典元素进行访问：

^{pr2}$

等等

网友

2楼 · 编辑于 2024-09-30 14:22:47

您需要获取所有xlsx文件，而不是使用comprehension dict，您可以访问任何elm

import pandas as pd
import os
import glob

path = 'Your_path'
extension = 'xlsx'
os.chdir(path)
result = [i for i in glob.glob('*.{}'.format(extension))]

{elm:pd.ExcelFile(elm) for elm in result}

网友

3楼 · 编辑于 2024-09-30 14:22:47

为了完整起见，我想展示我最终使用的解决方案，非常接近Khelili的建议，只做了一些调整以适应我的特定代码，包括在这个阶段不创建数据帧

import os
import pandas as pd
import openpyxl as excel
import glob



#setting up path

path = 'data_inputs'
extension = 'xlsx'
os.chdir(path)
files = [i for i in glob.glob('*.{}'.format(extension))]

#Grouping files - brings multiple files of same type together in a list 

wild_groups = ([s for s in files if "wild" in s])
domestic_groups = ([s for s in files if "domestic" in s])

#Sets up a dictionary associated with the file groupings to be called in another module 
file_names = {"WILD":wild_groups, "DOMESTIC":domestic_groups}
...

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据文件nam将多个.xlsx文件从一个目录读入单独的Pandas数据帧

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >