我正在尝试重新索引一个多索引熊猫系列使用元组列表。该系列的结构如下
(Pdb) object
respondent brand
0 Asda 6
1 Tesco 7
2 Asda 9
3 Aldi 2
4 Asda 4
Name: rating, dtype: int64
多指标结构如下
(Pdb) obj.index
MultiIndex(levels=[[0, 1, 2, 3, 4], [u'Aldi', u'Asda', u'Tesco']],
labels=[[0, 1, 2, 3, 4], [1, 2, 1, 0, 1]],
names=[u'respondent', u'brand'])
在我做了如下的重新索引之后
indexes = [(0, u'Asda'), (0, u'Tesco'), (0, u'Aldi'), (0, u'pick'), (1, u'Asda'), (1, u'Tesco'), (1, u'Aldi'), (1, u'pick'), (2, u'Asda'), (2, u'Tesco'), (2, u'Aldi'), (2, u'pick'), (3, u'Asda'), (3, u'Tesco'), (3, u'Aldi'), (3, u'pick'), (4, u'Asda'), (4, u'Tesco'), (4, u'Aldi'), (4, u'pick')]
obj.reindex(index=indexes, fill_value=default)
结果是
0 Asda 6
Tesco 0
Aldi 0
pick 0
1 Asda 0
Tesco 7
Aldi 0
pick 0
2 Asda 9
Tesco 0
Aldi 0
pick 0
3 Asda 0
Tesco 0
Aldi 2
pick 0
4 Asda 4
Tesco 0
Aldi 0
pick 0
现在,多重索引
MultiIndex(levels=[[0, 1, 2, 3, 4], [u'Aldi', u'Asda', u'Tesco', u'pick']],
labels=[[0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 3, 4, 4, 4, 4], [1, 2, 0, 3, 1, 2, 0, 3, 1, 2, 0, 3, 1, 2, 0, 3, 1, 2, 0, 3]])
这是一个问题,因为索引名已被删除。有什么办法可以防止这种情况发生吗?怎么能修好呢?你知道吗
我最终选择了一个稍微不同的方法,这对我来说效果更好。我最终建立了一个新的索引/多索引,正确地命名它,然后对它进行重新索引。你知道吗
我想我们可以创建一个新的
DataFrame
,然后将值从原始的DataFrame
添加到新的DataFrame
:相关问题 更多 >
编程相关推荐