合并具有不同日期时间频率的数据帧而不使用NAN

2024-09-26 18:06:15 发布

您现在位置:Python中文网/ 问答频道 /正文

我尝试合并两个具有不同日期时间频率的数据帧,并用重复的值填充丢失的值。你知道吗

数据帧df1,分钟频率:

    time
0   2017-06-01 00:00:00
1   2017-06-01 00:01:00
2   2017-06-01 00:02:00
3   2017-06-01 00:03:00
4   2017-06-01 00:04:00

每小时频率的数据帧df2:

    time2               temp    hum
1   2017-06-01 00:00:00 13.5    90.0
2   2017-06-01 01:00:00 12.2    95.0
3   2017-06-01 02:00:00 11.7    96.0
4   2017-06-01 03:00:00 11.5    96.0
5   2017-06-01 04:00:00 11.1    97.0

到目前为止,我合并了这些数据帧,但得到了NaN:

m2o_merge = df1.merge(df2, left_on= 'time', right_on= 'time2', how='outer')
m2o_merge.head()

    time       time2                temp    hum
0   2017-06-01 00:00:00 2017-06-01  13.5    90.0
1   2017-06-01 00:01:00 NaT         NaN     NaN
2   2017-06-01 00:02:00 NaT         NaN     NaN
3   2017-06-01 00:03:00 NaT         NaN     NaN
4   2017-06-01 00:04:00 NaT         NaN     NaN

我想要的数据帧应该是这样的(用小时值df2填充):

    time                temp    hum
0   2017-06-01 00:00:00 13.5    90.0
1   2017-06-01 00:01:00 13.5    90.0
2   2017-06-01 00:02:00 13.5    90.0
3   2017-06-01 00:03:00 13.5    90.0
4   2017-06-01 00:04:00 13.5    90.0
...

到目前为止,我找到了这个解决方案:merge series/dataframe with different time frequencies in python,但是Datetime列不是我的索引。有人知道怎么去吗?你知道吗


Tags: 数据timeon时间mergenannattemp
1条回答
网友
1楼 · 发布于 2024-09-26 18:06:15

根据Ben Pap的建议,我做了以下两个步骤作为解决方案:

import pandas as pd 
data1 = {'time':pd.date_range('2017-06-01 00:00:00','2017-06-01 00:09:00', freq='T')} 
data2 = {'time2':pd.date_range('2017-06-01 00:00:00','2017-06-01 04:00:00', freq='H'), 'temp':[13.5,12.2,11.7,11.5,11.1], 'hum':[90.0,95.0,96.0,96.0,97.0]}

# Create DataFrame
df1 = pd.DataFrame(data1) 
df2 = pd.DataFrame(data2) 

m2o_merge = df1.merge(df2, left_on= 'time', right_on= 'time2', how='outer')
m2o_merge.head()

m2o_merge.fillna(method='ffill', inplace=True)
filled_df = m2o_merge.drop(['time2'], axis=1)
filled_df.head()

相关问题 更多 >

    热门问题