Python使用列中的上一个记录值填充NULL

import pandas as pd df = pd.DataFrame([['NewJersy',0,'2020-08-29'], ['NewJersy',12,'2020-08-30'], ['NewJersy',12,'2020-08-31'], ['NewJersy',None,'2020-09-01'], ['NewJersy',None,'2020-09-02'], ['NewJersy',None,'2020-09-03'], ['NewJersy',5,'2020-09-04'], ['NewJersy',5,'2020-09-05'], ['NewJersy',None,'2020-09-06'], ['NewYork',None,'2020-08-29'], ['NewYork',None,'2020-08-30'], ['NewYork',8,'2020-08-31'], ['NewYork',7,'2020-09-01'], ['NewYork',None,'2020-09-02'], ['NewYork',None,'2020-09-03']], columns=['FName', 'FVal', 'GDate']) print(df)

3条回答

网友

1楼 · 编辑于 2024-10-01 02:28:38

您应首先确保数据帧随时间排序，以防：

df = df.sort_values('GDate').reset_index(drop=True)

然后必须用0填充第一个值：

if pd.isnull(df.loc[0, 'FVal']):
    df.loc[0, 'FVal'] = df.loc[0, 'FVal']

然后像您所做的那样向前填充：

df['FVal'] = df['FVal'].fillna(method='ffill')

请注意，列名是FVal而不是F

网友

2楼 · 编辑于 2024-10-01 02:28:38

您可以尝试以下方法：

df.GDate = pd.to_datetime(df.GDate)
for i in range(len(df)):
    if (np.isnan(df.FVal.loc[i])) and (i > 0):
        if (df.GDate.loc[i]-df.GDate.loc[i-1]).days == 1:
            print((df.GDate.loc[i]-df.GDate.loc[i-1]).days)
            df.FVal.loc[i] = df.FVal.loc[i-1]
        else:
            df.FVal.loc[i] = 0

输出

    FName       FVal    GDate
0   NewJersy    0.0     2020-08-29
1   NewJersy    12.0    2020-08-30
2   NewJersy    12.0    2020-08-31
3   NewJersy    12.0    2020-09-01
4   NewJersy    12.0    2020-09-02
5   NewJersy    12.0    2020-09-03
6   NewJersy    5.0     2020-09-04
7   NewJersy    5.0     2020-09-05
8   NewJersy    5.0     2020-09-06
9   NewYork     0.0     2020-08-29
10  NewYork     0.0     2020-08-30
11  NewYork     8.0     2020-08-31
12  NewYork     7.0     2020-09-01
13  NewYork     7.0     2020-09-02
14  NewYork     7.0     2020-09-03

网友

3楼 · 编辑于 2024-10-01 02:28:38

不确定这是否是你想要的。但这就是我要做的

>>> import math
>>> for s in df.iterrows():
...     if math.isnan(s[1][1]):
...        df.iloc[s[0],1] = df.iloc[s[0] - 1,1]
...
>>> df
       FName  FVal       GDate
0   NewJersy   0.0  2020-08-29
1   NewJersy  12.0  2020-08-30
2   NewJersy  12.0  2020-08-31
3   NewJersy  12.0  2020-09-01
4   NewJersy  12.0  2020-09-02
5   NewJersy  12.0  2020-09-03
6   NewJersy   5.0  2020-09-04
7   NewJersy   5.0  2020-09-05
8   NewJersy   5.0  2020-09-06
9    NewYork   5.0  2020-08-29
10   NewYork   5.0  2020-08-30
11   NewYork   8.0  2020-08-31
12   NewYork   7.0  2020-09-01
13   NewYork   7.0  2020-09-02
14   NewYork   7.0  2020-09-03
>>>

相关问题更多 >

编程相关推荐

热门问题

热门文章