我想选择或保持相同的事务描述(TRNDESCR),使用Pandas dataframe至少只发生3个月。我尝试了一些代码,但没有按预期工作。你知道吗
以下是示例数据集:
ACNO TIME TRNCD TRNDESCR TRNAMT
0 85 2018-12-19 20:40:00 109 Ib Transfer To Phoutthalom Syh Account No:123 -20000
1 85 2018-12-19 21:15:00 109 Ib Transfer To Phoutthalom Syh Account No:123 -25000
2 85 2018-12-20 15:30:00 109 Ib Transfer To Thongsavath Pra Account No:124 -10000
3 85 2018-12-22 12:30:00 209 Bil Payment -500
4 85 2018-12-25 15:34:00 109 Ib Transfer To Phoutthalom Syh Account No:123 -60000
5 85 2019-01-22 12:30:00 209 Bil Payment -501
6 85 2019-01-23 12:50:00 109 Ib Transfer To Sarah Account No:199 -3000
7 85 2019-01-31 08:59:00 109 Ib Transfer To Thongsavath Pra Account No:124 -650000
8 85 2019-02-02 12:30:00 109 Ib Transfer To Sarah Account No:199 -600
9 85 2019-02-03 15:02:00 109 Ib Transfer To Phoutthalom Syh Account No:123 -60000
10 85 2019-02-04 15:21:00 109 Ib Transfer To Thongsavath Pra Account No:124 -863000
11 85 2019-02-05 15:30:00 209 Bil Payment -600
预期结果如下:
ACNO TIME TRNCD TRNDESCR TRNAMT
0 85 2018-12-20 15:30:00 109 Ib Transfer To Thongsavath Pra Account No:124 -10000
1 85 2018-12-22 12:30:00 209 Bil Payment -500
2 85 2019-01-22 12:30:00 209 Bil Payment -501
3 85 2019-01-31 08:59:00 109 Ib Transfer To Thongsavath Pra Account No:124 -650000
4 85 2019-02-04 15:21:00 109 Ib Transfer To Thongsavath Pra Account No:124 -863000
5 85 2019-02-05 15:30:00 209 Bil Payment -600
这是我的解决办法
输出
它的工作原理是创建一个新列“yearmonth”(它是年+月的串联)。然后它执行groupby来trndescrc并计算每个组的唯一yearmonth数。你知道吗
选择被认为是一个指标的列,就像你给出的例子一样,它是TRNDESCR,也可以是你想要的时间,把“月”作为过滤器。然后删除duplicate并按TRNDESCR分组,然后根据月份计算事务发生的次数。你知道吗
示例:
相关问题 更多 >
编程相关推荐