我可以用分组数据帧中的列模式来替换Nans吗？

2条回答

网友

1楼 · 编辑于 2024-10-06 04:21:02

使用groupby，然后使用mode。注意，mode返回一个数组，您需要获取它的第一个元素。@约翰·高尔特值得称赞，我投了赞成票。在

我使用assign创建df的副本，其中包含{}列的覆盖版本。在

df.assign(
    Trim=df.groupby(
        ['Year', 'Make', 'Model']
    ).Trim.apply(
        lambda x: x.fillna(x.mode()[0])
    )
)

   Year   Make Model  Trim
0  2007  Acura    TL  Base
1  2007  Acura    TL   XLR
2  2007  Acura    TL  Base
3  2007  Acura    TL  Base

您可以直接用

^{pr2}$

网友

2楼 · 编辑于 2024-10-06 04:21:02

使用模式

In [215]: df
Out[215]:
   Year   Make    Model  Trim
0  2007  Acura       TL  Base
1  2010  Dodge  Avenger   SXT
2  2009  Dodge  Caliber   NaN
3  2008  Dodge  Caliber   SXT
4  2008  Dodge  Avenger   SXT

In [216]: df.Trim.fillna(df.Trim.mode()[0])
Out[216]:
0    Base
1     SXT
2     SXT
3     SXT
4     SXT
Name: Trim, dtype: object

使用inplace=True来实际设置

^{pr2}$

如果你在小组工作

In [227]: df
Out[227]:
   Year   Make Model  Trim
0  2007  Acura    TL  Base
1  2007  Acura    TL   XLR
2  2007  Acura    TL   NaN
3  2007  Acura    TL  Base

In [228]: (df.groupby(['Year', 'Make', 'Model'])['Trim']
             .apply(lambda x: x.fillna(x.mode()[0])))
     ...:
Out[228]:
0    Base
1     XLR
2    Base
3    Base
Name: Trim, dtype: object

相关问题更多 >

编程相关推荐

热门问题

热门文章

我可以用分组数据帧中的列模式来替换Nans吗？

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >