从现有datafram创建多索引

网友

1楼 · 编辑于 2024-10-05 13:13:56

为了澄清未来的用户，我想添加以下内容：

正如亚历山大所说

df.set_index(['user_id', 'account_num', 'dates'])

用一个可能的inplace=True来做这个工作。

type(df)给出

pandas.core.frame.DataFrame

然而type(df.index)确实是预期的

pandas.core.indexes.multi.MultiIndex

网友

2楼 · 编辑于 2024-10-05 13:13:56

在这种情况下，您可以简单地使用groupby，当它沿着请求的列对销售额求和时，将自动创建多索引。

df.groupby(['user_id', 'account_num', 'dates']).sales.sum().to_frame()

您还应该能够简单地执行以下操作：

df.set_index(['user_id', 'account_num', 'dates'])

尽管您可能希望通过求和来避免任何重复（例如，两行或多行具有相同的user_id、account_num和date值，但销售数字不同），这也是我建议使用groupby的原因。

如果需要多索引，只需通过new_df.index访问，其中new_df是从上述两个操作之一创建的新数据帧。

而user_id将是0级，account_num将是1级。

网友

3楼 · 编辑于 2024-10-05 13:13:56

使用^{}

lvl0 = currentDataFrame.user_id.values
lvl1 = currentDataFrame.account_num.values

midx = pd.MultiIndex.from_arrays([lvl0, lvl1], names=['level 0', 'level 1'])

相关问题更多 >

编程相关推荐

热门问题

热门文章

从现有datafram创建多索引

相关问题 更多 >

编程相关推荐

热门问题

热门文章

相关问题更多 >