排序值时理解groupby（）函数

retail_price product_category_tree 571230.0 ["Watches >> Wrist Watches >> Breitling Wrist ... 250500.0 ["Furniture >> Living Room >> Sofas & Sectiona... 217500.0 ["Furniture >> Living Room >> Sofas & Sectiona... 204600.0 ["Furniture >> Living Room >> Sofas & Sectiona... 201000.0 ["Watches >> Wrist Watches >> Cartier Wrist Wa... ... ... 59.0 ["Toys & School Supplies >> School Supplies >>... 55.0 ["Pens & Stationery >> Office Supplies >> File... 49.0 ["Pens & Stationery >> School Supplies >> Penc... 36.0 ["Home Improvement >> Electricals >> Switches ... 35.0 ["Kitchen & Dining >> Housekeeping & Laundry >..

2条回答

网友

1楼 · 编辑于 2024-09-28 23:21:44

如果你按价格分组，那么max没有多大意义，因为每个组只有一个价格。所以我猜你想得到每个产品类别中最昂贵的商品。如果是这样，那么您可以使用groupby和rank来实现此目的

ranks = df.groupby('product_category_tree')['retail_price'].rank(method='dense', axis=1, ascending=False)

df = df.assign(grp_rank=ranks)

df.loc[df.grp_rank == 1, :]

网友

2楼 · 编辑于 2024-09-28 23:21:44

我相信我一直在寻找一个简单的sort_values()函数。我按感兴趣的列对数据集进行了排序：

df = df.sort_values(by=['retail_price'], ascending=False)

这给了我下表：

       retail_price     product_category_tree
116     571230.0        ["Watches >> Wrist Watches >> Breitling Wrist ...
11631   250500.0        ["Furniture >> Living Room >> Sofas & Sectiona...
11507   217500.0        ["Furniture >> Living Room >> Sofas & Sectiona...
11464   204600.0        ["Furniture >> Living Room >> Sofas & Sectiona...
134     201000.0        ["Watches >> Wrist Watches >> Cartier Wrist Wa...

相关问题更多 >

编程相关推荐

热门问题

热门文章