我有以下汇总:
def my_agg(x):
names = {
'first_seen': x['first_seen'].min(),
'last_seen': x['last_seen'].max(),
'md5s': x['md5s'].tolist(),
}
return pd.Series(names, index=['first_seen', 'last_seen', 'md5s'])
但是在我的结果中,我有这样的东西,但是我想要一个所有md5的联合
^{pr2}$我应该使用什么函数来代替tolist()?在
以下是我的DataFrame和GroupBy:
df = pd.DataFrame.from_dict(some_data, orient='index')
gr = df.groupby(level=0, axis=0).apply(my_agg)
有些数据的格式如下:
{"foo": {"first_seen": "2019-02-15", "last_seen":"2019-02-20",
"md5s": ["md5_1", "md5_2", ...]},
"bar": {...}}
我不得不用sum()代替tolist()
这有点让人困惑,因为当你想到一个和的时候,你想到的是加法而不是加入列表。但它起作用了!在
相关问题 更多 >
编程相关推荐