我有一个数据帧,其中一列包含ID,另一列包含数字:
df1 = {'ID':[400, 400, 400, 400, 400, 400, 500, 500, 500, 500],
'Number':[1, 2, 3, 4, 8, 9, 22, 23, 26, 27]}
您可能会注意到,每个Id在“Number”列中都有相应的连续数字序列。例如:
ID400包含一个长度为4{1,2,3,4}的序列和另一个长度为2{8,9}的序列
我想获得每个Id对应序列的平均长度。 在本例中:
df2 = {'ID':[400, 500], 'avg_length':[3, 2]}
任何想法都将不胜感激!你知道吗
^{} +^{} +^{}
可以将
groupby
与自定义函数一起使用:这里有一种方法,使用groupby两次
选项2:不使用apply两次,仍然使用前面创建的tmp列
相关问题 更多 >
编程相关推荐