我有一个非常大的数据框,有多年的销售数据和数以万计的歪斜ID(即):
date skew_id units_sold
0 2001-01-01 123 1
1 2001-01-02 123 2
2 2001-01-03 123 3
3 2001-01-01 456 4
4 2001-01-02 456 5
...
我有另一个数据帧,它将skew\u id映射到skew\u price(即):
skew_id skew_price
0 123 100.00
1 456 10.00
...
我的第一个数据帧是如此之大,以至于我不能在没有达到内存限制的情况下进行合并。你知道吗
我想计算每日收入(即):
date revenue
0 2001-01-01 140
1 2001-01-02 250
2 2001-01-03 300
...
我认为这取决于行的数量、唯一
skew_id
值的数量和RAM
的大小。你知道吗一种可能的解决方案是
map
:您可以通过groupby实现这一点:
或者如果你遇到记忆问题,你可以自己循环所有的日期。速度较慢,但可能需要较少的内存。你知道吗
相关问题 更多 >
编程相关推荐