我有一个这样的pandas DataFrame
:
df = pd.DataFrame({'custid':[1,2,3,4],
...: 'prod1':['jeans','tshirt','jacket','tshirt'],
...: 'prod1_hnode1':[1,2,3,2],
...: 'prod1_hnode2':[6,7,8,7],
...: 'prod2':['tshirt','jeans','jacket','shirt'],
...: 'prod2_hnode1':[2,1,3,4],
...: 'prod2_hnode2':[7,6,8,7]})
In [54]: df
Out[54]:
custid prod1 prod1_hnode1 prod1_hnode2 prod2 prod2_hnode1 \
0 1 jeans 1 6 tshirt 2
1 2 tshirt 2 7 jeans 1
2 3 jacket 3 8 jacket 3
3 4 tshirt 2 7 shirt 4
prod2_hnode2
0 7
1 6
2 8
3 7
如何将其转换为以下格式:
^{pr2}$
使用:
custid
NaN
替换为rec
MultiIndex
的列这是另一种应该有效的方法,但是使用重复的
melt
s你在评论中提到了R。
melt
来自“数据表“应该能够更容易地处理这一问题,因为您可以一次熔化多组列,这与使用baser的reshape
函数类似。在基本R方法可能大致如下:
^{pr2}$相关问题 更多 >
编程相关推荐