根据时间戳在目录中合并csv文件

2024-09-26 22:10:36 发布

您现在位置:Python中文网/ 问答频道 /正文

我目前正在学习Python进行数据操作。我已经编写了一个基本脚本来获取两个csv文件,并根据时间戳合并它们,生成另一个csv文件,这是这些合并数据集的结果。在

但是,我很难创建一种方法来合并基于时间戳的目录中的多个csv文件。这是我目前所拥有的:

import pandas as pd
from datetime import datetime

dataset1 = pd.read_csv('ds1.csv', index_col=0, parse_dates=[0])
dataset2 = pd.read_csv('ds2.csv', index_col=0, parse_dates=[0])

combinecsv = pd.merge(dataset1,dataset2, on='DateTime',how = 'outer')
combinecsv.to_csv(r"C:\Users\General\Documents\Data\combined.csv")

validcsv = pd.merge(dataset1,dataset2, on='DateTime',how = 'inner')
validcsv.to_csv(r"C:\Users\General\Documents\Data\valid.csv")

任何建议或指导,看在哪里能够学习如何合并多个(10+以上)基于时间戳的csv文件将不胜感激。在

谢谢!在


Tags: 文件csv数据importreaddatetimeindexparse
1条回答
网友
1楼 · 发布于 2024-09-26 22:10:36

您可以使用pathlib的Path.glob()列出目录中的所有.csv文件:

for csv in Path(r'C:\Temp').glob('*.csv'):
    # do something with csv
    pass

然后,可以将每个next.csv的内容和列添加到现有集合中:

^{pr2}$

请注意,运行脚本两次将包括作为输入的输出-将它们写到其他地方可能是明智的。在

相关问题 更多 >

    热门问题