Pandas排序透视表还是分组数据帧?

2024-09-28 23:39:33 发布

您现在位置:Python中文网/ 问答频道 /正文

我有个问题。我这样做了:

In [405]: pippo=ass_t1.pivot_table(['Rotazioni a volume','Distribuzione Ponderata'],rows=['SEGM1','DESC']).sort()

In [406]: pippo
Out[406]: 
                      Distribuzione Ponderata  Rotazioni a volume
SEGM1 DESC                                                       
AD     ACCADINAROLO                    74.040       140249.693409
      ZYMIL AMALAT Z                   90.085       321529.053570
FUN   SPECIALMALAT S                   88.650       120711.182177
NORM   STD INNAROLO                    49.790       162259.216710
       STD P.NAROLO                    52.125      1252174.695695
       STD PLNAROLO                    54.230       213257.829615
      BONTA' MALAT B                   79.280       520454.366419
      DA STD RILGARD                   35.290       554927.497875
      OVANE VT.MANTO                   15.040       466232.639628
      WEIGHT MALAT W                   79.170       118628.572692

我的目标是将每个“SEGM1”按“Distribuzione pondeata”排序。E、 g.在“NORM”子集中,第一行应该是“BONTA'MALAT B”,具有更高级别的“distributione pondeata”。 我可以使用groupby方法实现部分结果,但不能设置多个列。 有人能帮我吗?在


Tags: innormdescstdt1volumeasssegm1
1条回答
网友
1楼 · 发布于 2024-09-28 23:39:33
import io
import pandas as pd
import numpy as np

text = '''\
SEGM1\tDESC\tDistribuzione Ponderata\tRotazioni a volume
AD\tACCADINAROLO\t74.040\t140249.693409
AD\tZYMIL AMALAT Z\t90.085\t321529.053570
FUN\tSPECIALMALAT S\t88.650\t120711.182177
NORM\tSTD INNAROLO\t49.790\t162259.216710
NORM\tSTD P.NAROLO\t52.125\t1252174.695695
NORM\tSTD PLNAROLO\t54.230\t213257.829615
NORM\tBONTA' MALAT B\t79.280\t520454.366419
NORM\tDA STD RILGARD\t35.290\t554927.497875
NORM\tOVANE VT.MANTO\t15.040\t466232.639628
NORM\tWEIGHT MALAT W\t79.170\t118628.572692
'''

df = pd.read_csv(io.BytesIO(text), delimiter = '\t',
                 index_col = (0,1),)

key1 = df.index.labels[0]
key2 = df['Distribuzione Ponderata'].rank(ascending=False)
sorter = np.lexsort((key2, key1))

sorted_df = df.take(sorter)
print(sorted_df)

收益率

^{pr2}$

我学会了这个技巧。关键思想是使用numpy.lexsort。在

相关问题 更多 >