将键值字典对应用于数据帧中的多个列

date env result cost 2021-03-01 dev gcp.dev.a 30 2021-03-01 prd gcp.prd.d 35 2021-03-01 dev gcp.dev.j 98 2021-03-01 sandbox gcp.sandbox.b 94

date env result cost 2021-03-01 dev gcp.dev.a 30 2021-03-01 prd gcp.prd.d 35 2021-03-01 dev gcp.dev.j 98 2021-03-01 sandbox gcp.sandbox.b 94 2021-03-01 dev gcp.dev.a 32 2021-03-01 prd gcp.prd.b 21 2021-03-01 prd gcp.prd.c 92

3条回答

网友

1楼 · 编辑于 2024-09-18 01:40:37

通过协构造函数创建新的数据帧，并通过^{}，最后一次正向填充date值将其添加到原始数据帧：

test  = {'a':32, 'b':21, 'c':92}

df1 = pd.DataFrame(list(test.items()), columns=['result','cost'])

df = pd.concat([df, df1], ignore_index=True)
df['date'] = df['date'].ffill()
print (df)
         date result  cost
0  2021-03-01      a    30
1  2021-03-01      d    35
2  2021-03-01      j    98
3  2021-03-01      b    94
4  2021-03-01      a    32
5  2021-03-01      b    21
6  2021-03-01      c    92

环路解决方案是可行的，但速度较慢，因此不建议：

for k, v in test.items():
    df.loc[len(df), ['result','cost']] = (k, v)

df['date'] = df['date'].ffill()

网友

2楼 · 编辑于 2024-09-18 01:40:37

您也可以通过使用pd.DateFrame.from_dict()方法、append()方法和ffill()方法来实现这一点：

test = {'a':32, 'b':21, 'c':92}

newdf=pd.DataFrame(test.values(),index=test.keys(),columns=['cost']).reset_index()
    #OR(use any one of them to create dataframe named newdf)
newdf=pd.DataFrame.from_dict(test,orient='index',columns=['cost']).reset_index().rename(columns={'index':'result'})

最后：

newdf=df.append(newdf,ignore_index=True).ffill()

现在，如果您打印newdf，您将获得所需的输出：

    date         result     cost
0   2021-03-01      a       30
1   2021-03-01      d       35
2   2021-03-01      j       98
3   2021-03-01      b       94
4   2021-03-01      a       32
5   2021-03-01      b       21
6   2021-03-01      c       92

网友

3楼 · 编辑于 2024-09-18 01:40:37

将result和cost设置为索引：

temp = df.set_index(['result', 'cost'])

从字典生成MultiIndex

test_index = pd.MultiIndex.from_tuples(test.items(), names = ['result', 'cost'])

用temp的索引和test_index的并集重新索引temp：

(temp
 .reindex(temp.index.union(test_index, sort = False))
 .ffill() 
 .reset_index()
 .reindex(columns = df.columns)
 )
 
         date result  cost
0  2021-03-01      a    30
1  2021-03-01      d    35
2  2021-03-01      j    98
3  2021-03-01      b    94
4  2021-03-01      a    32
5  2021-03-01      b    21
6  2021-03-01      c    92

相关问题更多 >

编程相关推荐

热门问题

热门文章