我有一些数据(最多Event
)和预期输出(Key
,Time
),如下所示:
+----------+------------+-------+-----+------+
| Location | Date | Event | Key | Time |
+----------+------------+-------+-----+------+
| i2 | 2019-03-02 | 1 | a | |
| i2 | 2019-03-02 | 1 | a | |
| i2 | 2019-03-02 | 1 | a | |
| i2 | 2019-03-04 | 1 | a | 2 |
| i2 | 2019-03-15 | 2 | b | 0 |
| i9 | 2019-02-22 | 2 | c | 0 |
| i9 | 2019-03-10 | 3 | d | |
| i9 | 2019-03-10 | 3 | d | 0 |
| s8 | 2019-04-22 | 1 | e | |
| s8 | 2019-04-25 | 1 | e | |
| s8 | 2019-04-28 | 1 | e | 6 |
| t14 | 2019-05-13 | 3 | f | |
+----------+------------+-------+-----+------+
每当Location
或Event
(或两者)更改时,就会创建一个新的Key
。我主要感兴趣的是Time
输出,即每个Key
的第一行和最后一行之间的天数差。如果Key
中有一行,Time
就是0。我们还需要创建Key
还是可以直接获得Time
间隙?你知道吗
我认为您不需要在这里创建
Key
矢量化方法
相关问题 更多 >
编程相关推荐