如何在现有列的基础上创建两个列？

import pandas as pd df = pd.DataFrame({'Car_ID': ['B332', 'B332', 'B332', 'C315', 'C315', 'C315', 'C315', 'C315', 'F310', 'F310'], \ 'Date': ['2018-03-15', '2018', '2018-03-12', '2018', '2018-03-16', '2018', \ '2018', '2018-03-11', '2018-03-10', '2018'], \ 'Driver': ['Alex', 'Alex', 'Alex', 'Sara', 'Sara', 'Sara', 'Sara', 'Sara', 'Franck','Franck']}) df Out: Car_ID Date Driver 0 B332 2018-03-15 Alex 1 B332 2018 Alex 2 B332 2018-03-12 Alex 3 C315 2018 Sara 4 C315 2018-03-16 Sara 5 C315 2018 Sara 6 C315 2018 Sara 7 C315 2018-03-11 Sara 8 F310 2018-03-10 Franck 9 F310 2018 Franck

Car_ID Date D_Min D_Max Driver 0 B332 2018-03-15 2018-03-15 2018-03-15 Alex 1 B332 2018 2018-03-12 2018-03-15 Alex 2 B332 2018-03-12 2018-03-12 2018-03-12 Alex 3 C315 2018 2018-03-16 2018 Sara 4 C315 2018-03-16 2018-03-16 2018-03-16 Sara 5 C315 2018 2018-03-11 2018-03-16 Sara 6 C315 2018 2018-03-11 2018-03-16 Sara 7 C315 2018-03-11 2018-03-11 2018-03-11 Sara 8 F310 2018-03-10 2018-03-10 2018-03-10 Franck 9 F310 2018 2018 2018-03-10 Franck

2条回答

网友

1楼 · 编辑于 2024-05-06 02:57:04

df_grpd = df.groupby('Car_ID').agg({'Date': [sorted, min, max]})
print df_grpd

                                              Date
                                            sorted   min         max
Car_ID
B332                [2018, 2018-03-12, 2018-03-15]  2018  2018-03-15
C315    [2018, 2018, 2018, 2018-03-11, 2018-03-16]  2018  2018-03-16
F310                            [2018, 2018-03-10]  2018  2018-03-10

网友

2楼 · 编辑于 2024-05-06 02:57:04

首先用布尔掩码和^{}将年份替换为NaNs，然后用^{}将^{}替换为^{}将NaNs替换为^{}：

#only years are numeric
mask = df['Date'].str.isnumeric()
#alternative mask -check length of string
#mask = df['Date'].str.len() == 4
#not numeric return NaNs, so test non NaNs
#mask = pd.to_numeric(df['Date'], errors='coerce').notna()

s = df['Date'].mask(mask)

g = s.groupby(df['Driver'])
df['D_Min'] = g.bfill().fillna(df['Date'])
df['D_Max'] = g.ffill().fillna(df['Date'])

print (df)
  Car_ID        Date  Driver       D_Min       D_Max
0   B332  2018-03-15    Alex  2018-03-15  2018-03-15
1   B332        2018    Alex  2018-03-12  2018-03-15
2   B332  2018-03-12    Alex  2018-03-12  2018-03-12
3   C315        2018    Sara  2018-03-16        2018
4   C315  2018-03-16    Sara  2018-03-16  2018-03-16
5   C315        2018    Sara  2018-03-11  2018-03-16
6   C315        2018    Sara  2018-03-11  2018-03-16
7   C315  2018-03-11    Sara  2018-03-11  2018-03-11
8   F310  2018-03-10  Franck  2018-03-10  2018-03-10
9   F310        2018  Franck        2018  2018-03-10

细节：

print (s)
0    2018-03-15
1           NaN
2    2018-03-12
3           NaN
4    2018-03-16
5           NaN
6           NaN
7    2018-03-11
8    2018-03-10
9           NaN
Name: Date, dtype: object

相关问题更多 >

编程相关推荐

热门问题

热门文章