Pandas日期重叠

2024-09-19 23:37:35 发布

您现在位置:Python中文网/ 问答频道 /正文

因此,我有一个相当困难的问题,已经困扰了我几天,涉及到熊猫数据帧。你知道吗

假设我有一个大约100000行的数据帧,其中包含以下列:

member_id, p1_start, p1_end, p2_start, and p2_end.

基本上,我想从这个数据帧中提取一个子集,其中包含所有具有重复member_ids的行。在这个子集中,我想特别选择member_ids,它的p1_start位于任何其他member_idsp1_startp2_end之间。你知道吗

有人知道怎么做吗?你知道吗

下面是一个dataframe的示例。你知道吗

    member_id   p2_start    p2_end  p3_start    p3_end
0   100042881   2013-03-25  2013-03-26  2013-03-26  2013-06-23
1   100085837   2012-09-24  2012-10-02  2012-10-02  2012-12-30
2   100086649   2014-02-17  2014-02-20  2014-02-20  2014-05-20
3   100091388   2014-10-18  2014-10-25  2014-10-25  2015-01-22
4   100273057   2013-03-06  2013-03-09  2013-03-09  2013-06-06

我想创建一个额外的列来标记行是否是重叠行。你知道吗


Tags: and数据标记idids示例dataframestart