在两个id上对Pandas中的重复项进行分组，并以不同的方式转换其余列

arrival_date bar_code stock_shop1 stock_shop2 price 1 2015-08-30 8000001 52 11 100 2 2015-08-30 8000001 48 0 85 3 2015-09-11 8000001 10 20 95 4 2015-10-04 8000002 5 10 50 5 2015-10-04 8000002 30 25 49

arrival_date bar_code stock_shop1 stock_shop2 price 1 2015-08-30 8000001 100 11 85 2 2015-09-11 8000001 10 20 95 3 2015-10-04 8000002 35 35 49

2条回答

网友

1楼 · 编辑于 2024-09-28 20:47:18

代码的问题是，您试图将Groupby object调用为-df.groupby(['arrival_date', 'bar_code'])(..)，因此出现了问题

您也不需要使用DataFrame.join，只需对多列使用groupby，然后使用.aggregate()（或.agg()）。示例-

df.groupby(['arrival_date', 'bar_code']).agg({'stock_shop1':sum,'stock_shop2':sum,'price':min})

如果不希望'arrival_date'和'bar_code'作为索引，可以调用.reset_index()来重置索引。示例-

df.groupby(['arrival_date', 'bar_code']).agg({'stock_shop1':sum,'stock_shop2':sum,'price':min}).reset_index()

演示-

In [14]: df
Out[14]:
  arrival_date  bar_code  stock_shop1  stock_shop2  price
1   2015-08-30   8000001           52           11    100
2   2015-08-30   8000001           48            0     85
3   2015-09-11   8000001           10           20     95
4   2015-10-04   8000002            5           10     50
5   2015-10-04   8000002           30           25     49

In [15]: df.groupby(['arrival_date', 'bar_code']).agg({'stock_shop1':sum,'stock_shop2':sum,'price':min})
Out[15]:
                       stock_shop2  stock_shop1  price
arrival_date bar_code
2015-08-30   8000001            11          100     85
2015-09-11   8000001            20           10     95
2015-10-04   8000002            35           35     49

In [16]: df.groupby(['arrival_date', 'bar_code']).agg({'stock_shop1':sum,'stock_shop2':sum,'price':min}).reset_index()
Out[16]:
  arrival_date  bar_code  stock_shop2  stock_shop1  price
0   2015-08-30   8000001           11          100     85
1   2015-09-11   8000001           20           10     95
2   2015-10-04   8000002           35           35     49

网友

2楼 · 编辑于 2024-09-28 20:47:18

是的，您可以这样做，在agg中您可以提到哪些聚合规则不能应用于每个列

In [121]: (df.groupby(['arrival_date', 'bar_code'])
             .agg({'stock_shop1': np.sum, 'stock_shop2': np.sum, 'price': np.min})
           )
Out[121]:
                       price  stock_shop1  stock_shop2
arrival_date bar_code
2015-08-30   8000001      85          100           11
2015-09-11   8000001      95           10           20
2015-10-04   8000002      49           35           35

相关问题更多 >

编程相关推荐

热门问题

热门文章