熊猫：重新取样分组的数据帧列，获取对应于最大值的离散特征

2024-05-02 02:38:08 发布

您现在位置：Python中文网/ 问答频道 /正文

6970

网友

男 | 程序猿一只，喜欢编程写python代码。

这与我之前问过的一个问题类似，但完全不同，因为当数据分组时，解决方案不起作用：

给出一些数据：

import pandas as pd
import numpy as np
import datetime

data = {'group':['a', 'a', 'a','b','a', 'b'], 
        'value': [1,2,3,4,3,5], 'names': ['joe', 'bob', 'greg','joe', 'bob', 'greg'],
        'dates': ['2015-01-01', '2015-01-02', '2015-01-03', '2015-01-03', '2015-01-04', '2015-01-04']}

df = pd.DataFrame(data=data, columns=["group", "value", "names"], 
                  index=pd.to_datetime(data['dates']))

给出：

^{pr2}$

我希望得到：

            group value names
2015-01-01      a     2   bob
2015-01-03      a     3   bob
2015-01-03      b     5  greg

因此，将数据分组，按2天（“2D”）重新采样，然后收集与最大“值”相对应的名称我尝试了以下错误：

(df.groupby('group').resample('2D')[['value']].idxmax()
   .assign(names=lambda x: df.loc[x.value]['names'].values,
           value=lambda x: df.loc[x.value]['value'].values)
)

Tags：数据 lambda import df data datetime names value

1条回答

网友

1楼 · 发布于 2024-05-02 02:38:08

分组后可以使用apply对值进行排序，按值命名列，然后取第一行。在

g = df.groupby(['group', pd.Grouper(freq='2D')])[['value', 'names']]
g.apply(lambda x: x.sort_values(['value', 'names'], ascending=[False, True]).iloc[0])\
 .reset_index('group')

           group  value names
2015-01-01     a      2   bob
2015-01-03     a      3   bob
2015-01-03     b      5  greg

这与使用重采样相同

^{pr2}$

熊猫：重新取样分组的数据帧列，获取对应于最大值的离散特征

相关问题更多 >

编程相关推荐

热门问题

热门文章

熊猫：重新取样分组的数据帧列，获取对应于最大值的离散特征

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >