我有一个数据框,看起来像:
LastName Date ObjectCol1 ObjectCol2 ObjectCol3 NumCol1 NumCol2 NumCol3 Intermediate1 Intermediate2
ABC March NA NA
ABC June NA NA
XYZ March NA Danger
XYZ June Danger Danger2
XYZ July Danger NA
AAA March NA NA
AAA June NA NA
DEF March NA NA
DEF June Danger Danger2
DEF July Danger NA
我想将此数据帧拆分为两个数据帧,这样只有那些在中间1和2列中具有“始终”(表示所有日期)的lastname具有“NA”(字符串对象)(非空)的lastname才会被过滤到这1个数据帧中。 第二个数据帧的中间*列中有一些记录,其中任何姓氏都有“非NA”值(在日期历史记录中至少有一次)
因此,对于上面的示例df,带有ABC和AAA的行将进入一个数据帧。 带有XYZ和DEF的行应该进入另一个数据帧
我正在研究groupby和筛选,但是日期列处理的效果并不好。 你有什么建议吗
首先通过^{} 与^{} 和^{} 获取所有与缺失值不匹配的
LastName
值,然后使用isin
测试LastName
的原始值,并通过df1
对~
进行反向掩码,对df2
进行非反向掩码测试:如果每组至少有一个} 和^{} 进行测试的替代解决方案:
True
,则使用^{相关问题 更多 >
编程相关推荐