按类别列出的平均行数

2024-09-28 19:03:33 发布

您现在位置:Python中文网/ 问答频道 /正文

所以我有一个数据帧,看起来像这样:

    year    geo_name            adult_obesity   some_college    STATE_ABBR
0   2015    Autauga County, AL  0.313           NaN             AL
1   2016    Autauga County, AL  0.309           0.565           AL
2   2017    Autauga County, AL  0.341           0.597           AL
3   2013    Baldwin County, AL  NaN             NaN             AL
4   2014    Baldwin County, AL  NaN             NaN             AL
5   2015    Baldwin County, AL  0.250           0.625           AL
6   2016    Baldwin County, AL  0.267           0.623           AL
7   2017    Baldwin County, AL  0.274           0.629           AL
8   2015    Barbour County, AL  0.384           0.423           AL
9   2016    Barbour County, AL  0.408           0.434           AL

我想把所有这些县的数据浓缩成州的数据,然后取每个州每年的平均值

因此,我需要一个具有唯一状态和年份的新数据集,以及具有相同状态和年份的原始其他行的平均值(adult_obesetysome_college

有什么方法可以轻易地用熊猫做到这一点吗


Tags: 数据状态somenanyeargeo平均值al
1条回答
网友
1楼 · 发布于 2024-09-28 19:03:33

您可以聚合mean

df = df.groupby(['year','STATE_ABBR'], as_index=False).mean()
print (df)
   year STATE_ABBR  adult_obesity  some_college
0  2013         AL            NaN           NaN
1  2014         AL            NaN           NaN
2  2015         AL       0.315667      0.524000
3  2016         AL       0.328000      0.540667
4  2017         AL       0.307500      0.613000

相关问题 更多 >