In [66]: t1
Out[69]:
job_date branch_id
2018-05 1 0.618980
2 0.600590
3 0.603486
4 0.043931
5 0.588168
6 0.381518
7 0.357035
2018-06 1 0.690575
2 0.700900
3 0.571556
4 0.351935
5 0.626428
6 0.461813
7 0.329663
Name: utilization, dtype: float64
In [86]: t1.index
Out[86]:
MultiIndex(levels=[[2018-05, 2018-06], [1, 2, 3, 4, 5, 6, 7]],
labels=[[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 2, 3, 4, 5, 6, 0, 1, 2, 3, 4, 5, 6]],
names=['job_date', 'branch_id'])
所以有区别
(2018-05,1)和(2018-06,1)应该是0.690575-0.618980=0.071595
如果我执行t1.diff(),就会得到逐行比较,这不是我想要的
^{pr2}$现在我在做这个
In [49]: t1.unstack(level=0)['utilization'].diff(axis=1)
Out[49]:
job_date 2018-05 2018-06
branch_id
1 NaN 0.071595
2 NaN 0.100310
3 NaN -0.031930
4 NaN 0.308003
5 NaN 0.038260
6 NaN 0.080295
7 NaN -0.027372
一个可能的解决方案是将
MultiIndex
移动一个月并减去,如果每个Period
之间的差异相同,则可以使用该方法-这里是一个月:您可以使用
groupby
,而不必像这样取消堆叠输出:
^{pr2}$相关问题 更多 >
编程相关推荐