我目前正在学习Python进行数据操作。我已经编写了一个基本脚本来获取两个csv文件,并根据时间戳合并它们,生成另一个csv文件,这是这些合并数据集的结果。在
但是,我很难创建一种方法来合并基于时间戳的目录中的多个csv文件。这是我目前所拥有的:
import pandas as pd
from datetime import datetime
dataset1 = pd.read_csv('ds1.csv', index_col=0, parse_dates=[0])
dataset2 = pd.read_csv('ds2.csv', index_col=0, parse_dates=[0])
combinecsv = pd.merge(dataset1,dataset2, on='DateTime',how = 'outer')
combinecsv.to_csv(r"C:\Users\General\Documents\Data\combined.csv")
validcsv = pd.merge(dataset1,dataset2, on='DateTime',how = 'inner')
validcsv.to_csv(r"C:\Users\General\Documents\Data\valid.csv")
任何建议或指导,看在哪里能够学习如何合并多个(10+以上)基于时间戳的csv文件将不胜感激。在
谢谢!在
您可以使用pathlib的
Path.glob()
列出目录中的所有.csv文件:然后,可以将每个next.csv的内容和列添加到现有集合中:
^{pr2}$请注意,运行脚本两次将包括作为输入的输出-将它们写到其他地方可能是明智的。在
相关问题 更多 >
编程相关推荐