大Pandas转台回廊

time,name,feature,value 33 20 May 2016 14:00:00 -0700,John,badL,2 45 19 May 2016 18:00:00 -0700,John,badL,1 120 17 May 2016 11:00:00 -0700,John,badL,1 220 20 May 2016 14:00:00 -0700,John,totalL,20 450 19 May 2016 18:00:00 -0700,John,totalL,15 330 18 May 2016 15:00:00 -0700,Mary,badL,2 330 18 May 2016 15:00:00 -0700,Mary,totalL,20 550 21 May 2016 12:00:00 -0700,Mary,adCmd,4 700 22 May 2016 16:00:00 -0700,Mary,PC,3 800 22 May 2016 16:00:00 -0700,Mary,eCon,200

2条回答

网友

1楼 · 编辑于 2024-09-26 18:02:55

这是df.pivot的作业：

import pandas as pd
from io import StringIO

df = pd.read_csv(StringIO(
'''
time,name,feature,value
33 20 May 2016 14:00:00 -0700,John,badL,2
45 19 May 2016 18:00:00 -0700,John,badL,1
120 17 May 2016 11:00:00 -0700,John,badL,1
220 20 May 2016 14:00:00 -0700,John,totalL,20
450 19 May 2016 18:00:00 -0700,John,totalL,15
330 18 May 2016 15:00:00 -0700,Mary,badL,2
330 18 May 2016 15:00:00 -0700,Mary,totalL,20
550 21 May 2016 12:00:00 -0700,Mary,adCmd,4
700 22 May 2016 16:00:00 -0700,Mary,PC,3
800 22 May 2016 16:00:00 -0700,Mary,eCon,200
'''), sep=',').set_index(['time', 'name'])

df_new = df.pivot(columns='feature').fillna(0).astype(int)

#                                     value
# feature                                PC adCmd badL eCon totalL
# time                           name
# 120 17 May 2016 11:00:00 -0700 John     0     0    1    0      0
# 220 20 May 2016 14:00:00 -0700 John     0     0    0    0     20
# 33 20 May 2016 14:00:00 -0700  John     0     0    2    0      0
# 330 18 May 2016 15:00:00 -0700 Mary     0     0    2    0     20
# 45 19 May 2016 18:00:00 -0700  John     0     0    1    0      0
# 450 19 May 2016 18:00:00 -0700 John     0     0    0    0     15
# 550 21 May 2016 12:00:00 -0700 Mary     0     4    0    0      0
# 700 22 May 2016 16:00:00 -0700 Mary     3     0    0    0      0
# 800 22 May 2016 16:00:00 -0700 Mary     0     0    0  200      0

网友

2楼 · 编辑于 2024-09-26 18:02:55

设置

from StringIO import StringIO
import pandas as pd

text = '''time,name,f1,value
20 May 2016 14:00:00 -0700,John,badL,2
19 May 2016 18:00:00 -0700,John,badL,1
17 May 2016 11:00:00 -0700,John,badL,1
20 May 2016 14:00:00 -0700,John,totalL,20
19 May 2016 18:00:00 -0700,John,totalL,15
17 May 2016 11:00:00 -0700,John,totalL,12
'''

df = pd.read_csv(StringIO(text))

print df

                         time  name      f1  value
0  20 May 2016 14:00:00 -0700  John    badL      2
1  19 May 2016 18:00:00 -0700  John    badL      1
2  17 May 2016 11:00:00 -0700  John    badL      1
3  20 May 2016 14:00:00 -0700  John  totalL     20
4  19 May 2016 18:00:00 -0700  John  totalL     15
5  17 May 2016 11:00:00 -0700  John  totalL     12

使用`unstack`

^{pr2}$

然后取消堆叠以执行旋转。它获取行索引的一部分并将其移动为列。在

print df.unstack()

                                value       
f1                               badL totalL
time                       name             
17 May 2016 11:00:00 -0700 John     1     12
19 May 2016 18:00:00 -0700 John     1     15
20 May 2016 14:00:00 -0700 John     2     20

在精神上，这是一个相同的解决方案亚基姆皮罗琴科。只是一个稍微不同的方法。这对我来说更直观，但对你可能不是。在

设置

使用`unstack`

相关问题更多 >

编程相关推荐

热门问题

热门文章