有没有办法在Python环境中“解压”数据帧列表？

网友

1楼 · 编辑于 2024-09-26 18:07:19

list2env的字面等价物是globals().update(...)或globals()[...] = ...，但通常使用显式字典会更好

正如其他人所建议的，显式变量类似于：

df = {
    os.path.splitext(filename)[0]: pd.read_excel(filename)
    for filename in os.listdir()
}

然后可以使用df["name"]引用每个数据帧

如果要将所有这些对象都制作成顶级对象，可以使用以下方法：

globals().update(df)

或者，在循环中：

for filename in os.listdir():
    bare_name = os.path.splitext(filename)[0]
    globals()[bare_name] = pd.read_excel(filename)

但是，这将使调试变得更加困难，存在用加载的数据帧替换内置函数和模块的风险，并且通常会导致每个阅读代码的人说“请不要这样做”。最多，在用于初始探索的笔记本中，它可能是正常的，而在生产代码中，它永远不会

网友

2楼 · 编辑于 2024-09-26 18:07:19

我建议您使用pathlib筛选特定文件：

from pathlib import Path

p = Path(folder_path)

筛选特定后缀：

 xlsx_files = p.rglob("*.xlsx")

与熊猫迭代：

 [pd.read_excel(f) for f in xlsx_files]

如果要保留文件名，可以使用字典：

 {f.name: pd.read_excel(f) for f in xlsx_files}

网友

3楼 · 编辑于 2024-09-26 18:07:19

我相信你可以使用条件词典理解：

dfs ={filename: pd.read_excel(filename) for filename in os.listdir()
      if filename.endswith('.xlsx')}

然后可以通过其文件名访问每个数据帧，例如dfs[filename]