根据给定条件筛选数据帧并添加新列

ID col1 col2 1 Abc street 2017-07-27 1 None 2017-08-17 1 Def street 2018-07-15 1 None 2018-08-13 2 fbg street 2018-01-07 2 None 2018-08-12 2 trf street 2019-01-15

3条回答

网友

1楼 · 编辑于 2024-05-13 08:07:32

今天的版本是用Numpy进行过度设计

尽管不可否认的是很少有明显的裸体

i, rows = pd.factorize([*zip(df.ID, df.col1.replace('None'))])
k, cols = pd.factorize(df.groupby(i).cumcount())

dleft = pd.DataFrame(dict(zip(['ID', 'col1'], zip(*rows))))
drigt = pd.DataFrame(index=dleft.index, columns=np.arange(len(cols)) + 2).add_prefix('col')
drigt.values[i, k] = df.col2.values

dleft.join(drigt)

   ID        col1        col2        col3
0   1  Abc street  2017-07-27  2017-08-17
1   1  Def street  2018-07-15  2018-08-13
2   2  fbg street  2018-01-07  2018-08-12
3   2  trf street  2019-01-15         NaN

网友

2楼 · 编辑于 2024-05-13 08:07:32

使用ffill+pivot_table。这假设None遵循正确的值，它似乎是从您的数据中得到的。在

u = df.assign(col1=df.col1.replace('None'))
g = ['ID', 'col1']
idx = u.groupby(g).cumcount()

(u.assign(idx=idx)
    .pivot_table(index=g, columns='idx', values='col2', aggfunc='first')
    .reset_index())

^{pr2}$

网友

3楼 · 编辑于 2024-05-13 08:07:32

我正在使用cumcount和merge

df1=df.loc[df.col1.ne('None'),:].copy()
df2=df.loc[df.col1.eq('None'),:].copy()
df1['Key']=df1.groupby('ID').cumcount()
df2['Key']=df2.groupby('ID').cumcount()
df1.merge(df2.drop('col1',1),on=['ID','Key'],how='left')
Out[816]: 
   ID       col1      col2_x  Key      col2_y
0   1  Abcstreet  2017-07-27    0  2017-08-17
1   1  Defstreet  2018-07-15    1  2018-08-13
2   2  fbgstreet  2018-01-07    0  2018-08-12
3   2  trfstreet  2019-01-15    1         NaN

今天的版本是用Numpy进行过度设计

相关问题更多 >

编程相关推荐

热门问题

热门文章

根据给定条件筛选数据帧并添加新列

今天的版本是用Numpy进行过度设计

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >