pandas从具有特定条件的数据帧（分组）中删除重复项

1条回答

网友

1楼 · 发布于 2024-10-01 05:02:58

我认为您需要在mv_str列中首先使用^{}字符串，然后创建新的DataFramedf1：

df1 = df.mv_str.str.split(expand=True)
print (df1)
          0       1     2
0  Exorsist   part1  None
1       doc     str    2D
2       doc     str    3D
3       doc     str    QA
4       doc   flash  None
5   plastic    None  None
6   plastic  income  None
7       doc     str    2D

按^{}添加原始DataFramedf：

^{pr2}$

然后^{}通过name、0和1列，第一个值仍然存在：

print (df.drop_duplicates(['name',0,1]))
  name          mv_str         0       1     2
0  abc  Exorsist part1  Exorsist   part1  None
1  abc      doc str 2D       doc     str    2D
4  abc       doc flash       doc   flash  None
5  def         plastic   plastic    None  None
6  def  plastic income   plastic  income  None
7  def      doc str 2D       doc     str    2D

按^{}删除列0、1、2：

print (df.drop_duplicates(['name',0,1]).drop([0,1,2], axis=1))
  name          mv_str
0  abc  Exorsist part1
1  abc      doc str 2D
4  abc       doc flash
5  def         plastic
6  def  plastic income
7  def      doc str 2D

或者最好只选择name和mv_str列来删除列：

print (df.drop_duplicates(['name',0,1])[['name','mv_str']])
  name          mv_str
0  abc  Exorsist part1
1  abc      doc str 2D
4  abc       doc flash
5  def         plastic
6  def  plastic income
7  def      doc str 2D

相关问题更多 >

编程相关推荐

热门问题

热门文章

pandas从具有特定条件的数据帧（分组）中删除重复项

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >