按类别列出的平均行数

2024-09-28 19:03:33 发布

男 | 程序猿一只，喜欢编程写python代码。

所以我有一个数据帧，看起来像这样：

    year    geo_name            adult_obesity   some_college    STATE_ABBR
0   2015    Autauga County, AL  0.313           NaN             AL
1   2016    Autauga County, AL  0.309           0.565           AL
2   2017    Autauga County, AL  0.341           0.597           AL
3   2013    Baldwin County, AL  NaN             NaN             AL
4   2014    Baldwin County, AL  NaN             NaN             AL
5   2015    Baldwin County, AL  0.250           0.625           AL
6   2016    Baldwin County, AL  0.267           0.623           AL
7   2017    Baldwin County, AL  0.274           0.629           AL
8   2015    Barbour County, AL  0.384           0.423           AL
9   2016    Barbour County, AL  0.408           0.434           AL

我想把所有这些县的数据浓缩成州的数据，然后取每个州每年的平均值

因此，我需要一个具有唯一状态和年份的新数据集，以及具有相同状态和年份的原始其他行的平均值（adult_obesety，some_college）

有什么方法可以轻易地用熊猫做到这一点吗

Tags：数据状态 some nan year geo 平均值 al

1条回答

网友

1楼 · 发布于 2024-09-28 19:03:33

您可以聚合mean：

df = df.groupby(['year','STATE_ABBR'], as_index=False).mean()
print (df)
   year STATE_ABBR  adult_obesity  some_college
0  2013         AL            NaN           NaN
1  2014         AL            NaN           NaN
2  2015         AL       0.315667      0.524000
3  2016         AL       0.328000      0.540667
4  2017         AL       0.307500      0.613000

按类别列出的平均行数

相关问题更多 >

编程相关推荐

热门问题

热门文章

按类别列出的平均行数

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >