groupby和agg by多列错误问题的回答

groupby和agg by多列错误

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我试图通过<code>monthtly_purchases</code>和<code>region</code>进行分组，以获得客户数量和每月支出总额，但是，我得到以下错误： 主数据帧： <pre><code>customer_id monthly_spending month monthtly_purchases region 32324 342 Feb-2019 5 A 34345 293 Feb-2019 5 A 45453 212 Feb-2019 3 A 34343 453 Feb-2019 3 A 53533 112 Feb-2019 5 B 12334 511 Feb-2019 5 B 99934 123 Feb-2019 3 B 21213 534 Feb-2019 3 B 32324 143 March-2019 5 A 34345 453 March-2019 5 A 45453 234 March-2019 3 A 34343 432 March-2019 3 A 53533 124 March-2019 5 B 12334 453 March-2019 5 B 99934 224 March-2019 3 B 21213 634 March-2019 3 B </code></pre> 输出数据帧： <pre><code>monthly_purchases region monthly_spending count_customers month 5 A 635 2 Feb-2019 3 A 665 2 Feb-2019 5 B 623 2 Feb-2019 3 B 657 2 Feb-2019 5 A 596 2 Feb-2019 3 A 666 2 Feb-2019 5 B 556 2 Feb-2019 3 B 858 2 Feb-2019 </code></pre> 这是我迄今为止尝试过的，但我得到以下错误： <pre><code>d = {'customer_id': ['count'], 'monthly_spending': ['sum']} agg_df = df.groupby('monthtly_purchases', 'region').agg(d) agg_df Error msg: No numeric types to aggregate </code></pre>

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

当使用超过2列或更多列的group by时，请记住将列名放入列表中： <pre><code>import pandas as pd df = pd.DataFrame([ [32324, 342, "Feb-2019", 5, "A"], [34345, 293, "Feb-2019", 5, "A"], [45453, 212, "Feb-2019", 3, "A"], [34343, 453, "Feb-2019", 3, "A"], [53533, 112, "Feb-2019", 5, "B"], [12334, 511, "Feb-2019", 5, "B"], [99934, 123, "Feb-2019", 3, "B"], [21213, 534, "Feb-2019", 3, "B"] ], columns=["customer_id", "monthly_spending", "month", "monthtly_purchases", "region"] ) d = {'customer_id': ['count'], 'monthly_spending': ['sum']} agg_df = df.groupby(["monthtly_purchases", "region"]).agg(d) print(agg_df) </code></pre> 返回： <pre><code> customer_id monthly_spending count sum monthtly_purchases region 3 A 2 665 B 2 657 5 A 2 635 B 2 623 </code></pre> 按照注释中的要求，明确多索引（通过创建新索引将其拆分为列）： <pre><code>agg_df.reset_index(inplace=True) print(agg_df) </code></pre> 返回： <pre><code> monthtly_purchases region customer_id monthly_spending count sum 0 3 A 2 665 1 3 B 2 657 2 5 A 2 635 3 5 B 2 623 </code></pre> 包括评论中要求的月份： <pre><code>agg_df = df.groupby(["month", "monthtly_purchases", "region"], as_index=False).agg(d) </code></pre> 返回： <pre><code> month monthtly_purchases region customer_id monthly_spending count sum 0 Feb-2019 3 A 2 665 1 Feb-2019 3 B 2 657 2 Feb-2019 5 A 2 635 3 Feb-2019 5 B 2 623 4 March-2019 3 A 2 666 5 March-2019 3 B 2 858 6 March-2019 5 A 2 596 7 March-2019 5 B 2 577 </code></pre>

groupby和agg by多列错误

1 个回答

相关Python问题