和Pandas有问题吗数据框代表

name name1 score1 score2 score3 0 ['Harry' 'Potter' 9 10 8] 1 ['Scrooge' 'McDuck' 7 5 6] 2 ['Shovel' 'Knight' 4 2 3]

df = pd.read_csv('classa.csv') print('Sorted scores') scores3 = df['score3'] scores3 = scores3.replace(']', '') scores = df[['score1', 'score2', 'score3']].values a = np.array(df[['score1', 'score2', 'score3']]) b = a.astype(int) a.sort(axis=1) df['score1'], df['score2'], df['score3'] = a.T print(df)

name name1 score1 score2 score3 0 ['Harry' 'Potter' 10 9 8] 1 ['Scrooge' 'McDuck' 7 6 5] 2 ['Shovel' 'Knight' 4 3 2]

name name1 score1 score2 score3 highestscoretolowestscore 0 ['Harry' 'Potter' 9 10 8] 10 9 8 1 ['Scrooge' 'McDuck' 7 5 6] 7 6 5 2 ['Shovel' 'Knight' 4 2 3] 4 3 2

name name1 score1 score2 score3 highestscoretolowestscore 0 ['Atticus' 'Finch' 9 10 8 None 1 ['Jem' 'Finch' 7 5 6 None 2 ['Jean Louise 'Finch' 4 2 3 None

1条回答

网友

1楼 · 发布于 2024-10-05 14:22:13

嗯，不知道你的csv看起来怎么样，有一种更好的方法可以根据csv的样子来做。但基本上你的问题是当你这样做的时候-

scores3 = scores3.replace(']', '')

您只需将分数3指向一个新的系列，这不会改变原始数据帧中的任何内容。你知道吗

你需要做-

df = pd.read_csv('classa.csv')
print('Sorted scores')
df['score3'] = df['score3'].str.replace(']', '')
df['score3'] = df['score3'].astype(int)
df = df.sort(['score1', 'score2', 'score3'], ascending=False)

示例/演示-

In [82]: df
Out[82]:
         name     name1  score1  score2 score3
0    ['Harry'  'Potter'       9      10     8]
1  ['Scrooge'  'McDuck'       7       5     6]
2   ['Shovel'  'Knight'       4       2     3]

In [83]: print('Sorted scores')
Sorted scores

In [84]: df['score3'] = df['score3'].str.replace(']', '')

In [85]: df['score3'] = df['score3'].astype(int)

In [86]: df = df.sort(['score1', 'score2', 'score3'], ascending=False)

In [87]: df
Out[87]:
         name     name1  score1  score2  score3
0    ['Harry'  'Potter'       9      10       8
1  ['Scrooge'  'McDuck'       7       5       6
2   ['Shovel'  'Knight'       4       2       3

对于您想要的（按行排序），您可以执行（非常类似于您自己的方法）—

df['score3'] = df['score3'].str.replace(']', '')
df['score3'] = df['score3'].astype(int)
a = np.array(df[['score1', 'score2', 'score3']])
a = a.astype(int)
a.sort(axis=1)
df['score1'], df['score2'], df['score3'] = a.T[::-1,:]

相关问题更多 >

编程相关推荐

热门问题

热门文章