如何用索引对数据帧中的值进行排序？

1 2 ... 80 81 0 778.txt 856.txt ... 831.txt 850.txt 1 0.002735042735042732 0.0054700854700846634 ... 0.01641025640567632 4.2490294446698094e-09 2 2.146512500161246e-28 8.006312700113502e-16 ... 4.580074538571013e-12 0.02017093592191074

id text 0 15623 Y:\n1. Ran preliminary experiments to set para... 1 15625 Scrum Minutes- Hersheys\nPresent: Eyob, Masres... 2 15627 Present: Eyob, Masresha, Zelalem\nhersheys:\n... 3 15628 **********************************************... 4 15629 Scrum Minutes- Hersheys\nPresent: Eyob, Masres...

1条回答

网友

1楼 · 发布于 2024-05-19 03:38:14

使用argsort with descending ordering表示具有数据帧构造函数的位置：

#create index by first column and transpose
df2 = df.set_index(0).T

arr = df2.columns.values[(-df2.values).argsort()]
df2 = pd.DataFrame({'id': df2.index, 
                    'score1': arr[:, 0].astype(int),
                    'score2': arr[:, 1].astype(int)})
print (df2)
   id  score1  score2
0   1       1       0
1   2       1       0
2   3       0       1
3   4       0       1
4  77       1       0
5  78       1       0
6  79       0       1
7  80       1       0
8  81       0       1

编辑：

^{pr2}$

编辑1：

df2 = df.T.set_index(0).astype(float)
print (df2)
                    1             2
0                                  
778.txt  2.735043e-03  2.146513e-28
856.txt  5.470085e-03  8.006313e-16
831.txt  1.641026e-02  4.580075e-12
850.txt  4.249029e-09  2.017094e-02


arr = (-df2.values).argsort()

score = (pd.Series(arr[:, 0].astype(str)) + ', ' + 
         pd.Series(arr[:, 1].astype(str)))
df2 = pd.DataFrame({'id': df2.index.str.replace('\.txt',''), 
                    'score': score})
print (df2)
    id score
0  778  0, 1
1  856  0, 1
2  831  0, 1
3  850  1, 0

相关问题更多 >

编程相关推荐

热门问题

热门文章