我的问题与我之前的问题相关,但不同。因此,创建了一个新的帖子
我想得到熊猫数据帧中datetime列的10分钟箱中的最大计数
我的桌子:
id1 date_time adress a_size
reom 2005-8-20 22:51:10 75157.5413 ceifwekd
reom 2005-8-20 22:55:25 3571.37946 ceifwekd
reom 2005-8-20 11:21:01 3571.37946 tnohcve
reom 2005-8-20 11:22:09 97439.219 tnohcve
reom 2005-8-20 11:25:09 97439.219 efgrcaw
penr 2005-8-20 17:07:16 97439.219 ceifwekd
penr 2005-8-20 19:10:37 7391.6258 ceifwekd
....
我需要:
id1 date_time adress a_size max_transaction
reom 2005-8-20 22:51:10 75157.5413 ceifwekd 2
reom 2005-8-20 22:55:25 3571.37946 ceifwekd 2
reom 2005-8-20 11:21:01 3571.37946 tnohcve 3
reom 2005-8-20 11:22:09 97439.219 tnohcve 3
reom 2005-8-20 11:25:09 97439.219 efgrcaw 3
penr 2005-8-20 17:07:16 97439.219 ceifwekd 1
penr 2005-8-20 19:10:37 7391.6258 ceifwekd 1
max_transaction是10分钟内存储箱中的最大事务数
例如
reom 2005-8-20 11:21:01 3571.37946 tnohcve 3
reom 2005-8-20 11:22:09 97439.219 tnohcve 3
reom 2005-8-20 11:25:09 97439.219 efgrcaw 3
这里,“reom”有3个11:21:01-11:25:09的事务,位于10分钟的存储箱中
我的代码:
df['num_per_10_min'] = df.groupby(['id1',df['date_time'].dt.floor('10Min')])['date_time'].agg('count')
不起作用
TypeError: incompatible index of inserted column with frame index
有什么建议吗
谢谢
试试
transform
和np.size
:相关问题 更多 >
编程相关推荐