Pandas：按实验室获取唯一的多索引级别值

df = pd.DataFrame({'co':['DE','DE','FR','FR'], 'tp':['Lake','Forest','Lake','Forest'], 'area':[10,20,30,40], 'count':[7,5,2,3]}) df = df.set_index(['co','tp'])

3条回答

网友

1楼 · 编辑于 2024-06-26 11:02:39

我想您需要在多索引的某个级别（以及按级别名称）中使用唯一值。我通常做以下的，这有点长。

In [11]: df.index.get_level_values('co').unique()
Out[11]: array(['DE', 'FR'], dtype=object)

网友

2楼 · 编辑于 2024-06-26 11:02:39

Pandas 0.23.0终于introduced解决这个问题的一个更清晰的解决方案：对Index.unique()的level参数：

In [3]: df.index.unique(level='co')
Out[3]: Index(['DE', 'FR'], dtype='object', name='co')

这是现在推荐的解决方案。它的效率更高，因为它避免了在内存中创建级别值的完整表示，并重新扫描它。

网友

3楼 · 编辑于 2024-06-26 11:02:39

另一种方法是通过调用df.index.levels[level_index]来查找级别数，其中可以从df.index.names.index(level_name)推断级别索引。在上面的示例中，level_name='co'。

@Happy001提出的答案计算出了唯一的，可能需要大量计算。

相关问题更多 >

编程相关推荐

热门问题

热门文章