dataframe基于其他列获取列的平均值

2条回答

网友

1楼 · 编辑于 2024-05-08 02:49:29

您可以将要忽略的值更改为nan，然后计算平均值。这可以通过df.replace({0: pd.NA})完成，如以下代码所示：

import pandas as pd

df = pd.DataFrame({
    "math": {"mark": 10, "tom":10, "hall": 0}, 
    "english": {"mark":0, "tom": 20,"hall":25},
    "chemistry": {"mark":20, "tom":30, "hall":15}
})
df["average_marks"] = df.replace({0: pd.NA}).mean(axis=1)
df

产出：

      math  english  chemistry  average_marks
mark    10        0         20           15.0
tom     10       20         30           20.0
hall     0       25         15           20.0

网友

2楼 · 编辑于 2024-05-08 02:49:29

在计算平均值之前，可以屏蔽零值：

df.assign(average_marks=df.mask(df.eq(0)).select_dtypes("number").mean(1))


    name    maths   english chemistry   average_marks
0   mark    10         0       20         15.0
1   tom     10        20       30         20.0
2   hall    0         25       15         20.0

@trimvi的解决方案更简单。这只是一种选择

相关问题更多 >

编程相关推荐

热门问题

热门文章

dataframe基于其他列获取列的平均值

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >