我有一个数据集,包含公司的每一笔销售。对于每个月,我都希望获得一个汇总数据框,其中包含客户的姓名、客户购买的数量以及他们在给定月份购买的总价值。目前,我正在为每个客户创建一个数据帧,并在最后连接所有数据帧,因此我的代码如下所示:
#"蒲公英数量"
Client2_April_NoPurchase = len(sells_data[(sells_data['Customer'] == 'Client2') & (sells_data['Month'] == 'Apr')])
#“采购总价值(美元)”
Client2_April_ValuePurchases = sells_data.loc[(sells_data['Customer'] == 'Client2') & (sells_data['Month'] == 'Apr'), 'Value of Purhcase (USD)'].sum()
#原始数据
Client2_Purchases_April_datadf = {'Customer': ['Client2'], 'Purchases (No.)': [(Client2_April_NoPurchase)], 'Value of Purhcase (USD)': [(Client2_April_ValuePurchases)]}
#数据帧
Client2_Purchases_April = pd.DataFrame(Client2_Purchases_April_datadf, columns = ['Customer', 'Purchases (No.)', 'Value of Purchases (USD)'])
我为每个客户机重复这段代码,这使得我的工具非常“手动”。有没有办法“自动化”这段代码?我曾想过创建一个函数,但我尝试过的所有函数都不起作用。还请注意,一些客户具有其他货币的购买价值(澳元、加元等),一些客户同时具有多种货币的购买价值(美元和加元等)
数据集示例(销售数据): enter image description here
以下是数据帧的可复制版本:
使用
groupby
您现在可以通过多种方式按客户机聚合数据。这一行对条目进行计数:相关问题 更多 >
编程相关推荐