我有一个包含文本和一些值计数的数据帧,例如:
dates=['01-01-15','01-01-15','01-01-15','02-01-15','02-01-15','02-01-15','02-01-15']
df3 = pd.DataFrame({'Number':['001','001','001','002','002','002','002'],
'name':['peter','chris','meg','albert','cathrine','leo','leo'],
'dummy':[0,1,0,0,0,1,1],
'dates': dates})
df3.dates=pd.to_datetime(df3.dates)
现在我想按“Number”列和sum对它进行分组,这样这些值将被求和,文本将成为一个包含所有条目的列表,每个组将有一个日期
如果我使用df4=pd.DataFrame(df3.groupby('Number').sum())
,它会对数字数据执行必要的操作,但会丢失text和date列
所以输出应该是这样的:
df4
Number name dummy dates
001 [peter,chris,meg] 1 01-01-15
002 [albert, cathrine, leo,leo] 2 02-01-15
要使用
.agg
指定多个聚合函数,如list
、sum
和first
:输出
熊猫版>;=0.25
由于verison0.25,我们不再使用字典,而是使用元组
参见docs
输出
相关问题 更多 >
编程相关推荐