大Pandas里的LISTAGG是什么意思?

2024-09-22 16:37:45 发布

您现在位置:Python中文网/ 问答频道 /正文

我有以下汇总:

def my_agg(x):
    names = {
        'first_seen': x['first_seen'].min(),
        'last_seen': x['last_seen'].max(),
        'md5s': x['md5s'].tolist(),
    }
    return pd.Series(names, index=['first_seen', 'last_seen', 'md5s'])

但是在我的结果中,我有这样的东西,但是我想要一个所有md5的联合

^{pr2}$

我应该使用什么函数来代替tolist()?在

以下是我的DataFrame和GroupBy:

df = pd.DataFrame.from_dict(some_data, orient='index')
gr = df.groupby(level=0, axis=0).apply(my_agg)

有些数据的格式如下:

{"foo": {"first_seen": "2019-02-15", "last_seen":"2019-02-20",
         "md5s": ["md5_1", "md5_2", ...]},
 "bar": {...}}

Tags: dataframedfindexnamesmydefmd5agg
1条回答
网友
1楼 · 发布于 2024-09-22 16:37:45

我不得不用sum()代替tolist()

'md5s': x['md5s'].sum()

这有点让人困惑,因为当你想到一个和的时候,你想到的是加法而不是加入列表。但它起作用了!在

相关问题 更多 >