如何定义qcut标签的函数?

2024-10-01 07:34:51 发布

您现在位置:Python中文网/ 问答频道 /正文

我使用pandas.qcut将数据分为5组,并希望根据qcut最小值和最大值标记每个组

例如,我尝试了数据框列中的“年龄”数据

df['age group'] = pd.qcut(df['age'], 5)

结果是

Categories (5, interval[float64]): [(37.999, 61.0] < (61.0, 67.0] < (67.0, 73.0] < (73.0, 78.0] < (78.0, 93.0]]

预期结果是根据最小值和最大值自动为每个组指定标签,例如。 类别1标签应为“37.999至60.999”,以此类推

现在,我做的标签手动查看每个类别范围。如何定义标签以使其符合预期?谢谢


Tags: 数据标记pandasdfagegroup标签类别
1条回答
网友
1楼 · 发布于 2024-10-01 07:34:51

您可以重新定义类别:

df['age group'] = pd.qcut(df['age'], 5)
df['age group'].cat.categories = [f'{i.left} to {i.right}' for i in df['age group'].cat.categories]

相关问题 更多 >