更新和合并datafram中的列

2条回答

网友

1楼 · 编辑于 2024-07-05 11:43:08

我认为需要：

df = pd.concat([df1, df2]).drop_duplicates(subset=['ID'], keep='last').sort_values('ID')
print (df)
    ID  A
0  ID1  5
1  ID2  1
2  ID3  8
3  ID4  8
3  ID5  7
4  ID6  8
5  ID7  9

解释：

首先^{}两个DataFrame一起：

print (pd.concat([df1, df2]))
    ID  A
0  ID1  5
1  ID2  6
2  ID3  7
3  ID4  8
0  ID1  5
1  ID2  1
2  ID3  8
3  ID5  7
4  ID6  8
5  ID7  9

因为创建了相同的ID，所以使用keep only last值^{}删除重复项：

print (pd.concat([df1, df2]).drop_duplicates(subset=['ID'], keep='last'))
    ID  A
3  ID4  8
0  ID1  5
1  ID2  1
2  ID3  8
3  ID5  7
4  ID6  8
5  ID7  9

最后按ID按^{}排序

网友

2楼 · 编辑于 2024-07-05 11:43:08

您可以使用Pandas的merge方法做同样的事情

可以使用以下合并函数合并df1和df2：

df = pd.merge(df2,df1, how ='outer')

这里我将df2与df1合并。outer使用来自两个数据帧的键的并集。Union将从df2获取所有密钥，并且仅从df1获取那些在df2中不可用的密钥

第二步是删除ID列中的重复行

df = df.drop_duplicates(subset=['ID'],keep='first')

这将删除列ID中的所有重复行，但第一次出现的行除外

第三步是根据ID列对行进行排序

df =df.sort_values('ID')

相关问题更多 >

编程相关推荐

热门问题

热门文章

更新和合并datafram中的列

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >