使用pandas read_cs解析多个日期列组合

2024-09-26 18:20:24 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在导入csv文件。有一个“日期”列包含日期,然后有几个(~20)其他列包含一天中的时间。我曾尝试将parse_dates=与read_cv一起使用,但当我组合多对列时,我得到一个“ValueError:Date column arrival already in dict”是parse_dates=字典中要读取的第二列。 以下是我正在做的(简单的例子):

df = read_csv('DH_timing_prep_stata_v4.csv', sep=',', index_col='pt_id', 
               parse_dates={'sch_appt_time_':['date', 'sch_appt_time'],
                            'arrival':['date', 'arrival']})

如果我在解析其ok时重命名列:

^{pr2}$

我试图在导入后重命名列

df.columns = ['sch_appt_time_', 'arrival', 'other', 'columns...']

这种方法的问题是,如果我在parse_dates字典中做了任何更改,列的顺序就会改变,因此重命名不再有效。在

我的目标是使用与cvs文件中相同的列名。最好的办法是什么?在


Tags: columns文件csvdfreaddate字典time

热门问题