pandas.diff按行的多索引值

In [66]: t1 Out[69]: job_date branch_id 2018-05 1 0.618980 2 0.600590 3 0.603486 4 0.043931 5 0.588168 6 0.381518 7 0.357035 2018-06 1 0.690575 2 0.700900 3 0.571556 4 0.351935 5 0.626428 6 0.461813 7 0.329663 Name: utilization, dtype: float64 In [86]: t1.index Out[86]: MultiIndex(levels=[[2018-05, 2018-06], [1, 2, 3, 4, 5, 6, 7]], labels=[[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1], [0, 1, 2, 3, 4, 5, 6, 0, 1, 2, 3, 4, 5, 6]], names=['job_date', 'branch_id'])

In [49]: t1.unstack(level=0)['utilization'].diff(axis=1) Out[49]: job_date 2018-05 2018-06 branch_id 1 NaN 0.071595 2 NaN 0.100310 3 NaN -0.031930 4 NaN 0.308003 5 NaN 0.038260 6 NaN 0.080295 7 NaN -0.027372

2条回答

网友

1楼 · 编辑于 2024-06-28 19:28:15

一个可能的解决方案是将MultiIndex移动一个月并减去，如果每个Period之间的差异相同，则可以使用该方法-这里是一个月：

a = df.index.get_level_values(0).to_period('M')
b = df.index.get_level_values(1)
mux1 = pd.MultiIndex.from_arrays([a,b], names=df.index.names)
mux2 = pd.MultiIndex.from_arrays([a + 1, b], names=df.index.names)

df = df.set_index(mux1)
df1 = df.set_index(mux2)

df['utilization'] = df.sub(df1)
print (df)
                    utilization
job_date branch_id             
2018-05  1                  NaN
         2                  NaN
         3                  NaN
         4                  NaN
         5                  NaN
         6                  NaN
         7                  NaN
2018-06  1             0.071595
         2             0.100310
         3            -0.031930
         4             0.308004
         5             0.038260
         6             0.080295
         7            -0.027372

网友

2楼 · 编辑于 2024-06-28 19:28:15

您可以使用groupby，而不必像这样取消堆叠

import pandas as pd

ix = pd.MultiIndex(
    levels=[['2018-05', '2018-06'], [1, 2, 3, 4, 5, 6, 7]],
    labels=[[0, 0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1, 1],
            [0, 1, 2, 3, 4, 5, 6, 0, 1, 2, 3, 4, 5, 6]],
    names=['job_date', 'branch_id'])


series = pd.Series(
    [0.618980, 0.600590, 0.603486, 0.043931, 0.588168, 0.381518,
     0.357035, 0.690575, 0.700900, 0.571556, 0.351935, 0.626428,
     0.461813, 0.329663], 
    index=ix)

series.groupby(by='branch_id').diff()

输出：

^{pr2}$

如何根据索引值对行进行区分？

有没有办法不拆箱？？

相关问题更多 >

编程相关推荐

热门问题

热门文章