因此,我有一个相当困难的问题,已经困扰了我几天,涉及到熊猫数据帧。你知道吗
假设我有一个大约100000行的数据帧,其中包含以下列:
member_id, p1_start, p1_end, p2_start, and p2_end.
基本上,我想从这个数据帧中提取一个子集,其中包含所有具有重复member_ids
的行。在这个子集中,我想特别选择member_ids
,它的p1_start
位于任何其他member_ids
p1_start
和p2_end
之间。你知道吗
有人知道怎么做吗?你知道吗
下面是一个dataframe的示例。你知道吗
member_id p2_start p2_end p3_start p3_end 0 100042881 2013-03-25 2013-03-26 2013-03-26 2013-06-23 1 100085837 2012-09-24 2012-10-02 2012-10-02 2012-12-30 2 100086649 2014-02-17 2014-02-20 2014-02-20 2014-05-20 3 100091388 2014-10-18 2014-10-25 2014-10-25 2015-01-22 4 100273057 2013-03-06 2013-03-09 2013-03-09 2013-06-06
我想创建一个额外的列来标记行是否是重叠行。你知道吗
目前没有回答
相关问题 更多 >
编程相关推荐