我是一个轻量级的熊猫用户,我遇到了一个棘手的情况。我想合并“case\u id”周围的数据集行。合并时,如果字符串是唯一的,我希望“Gene”列按字母顺序将字符串与“->;”连接起来。另外,有些列有0,有些列有1,我希望合并时用1代替0。你知道吗
df.groupby('case_id').agg(special_merge)
def special_merge(data):
//Handle 'Gene' Column ex. KRAS->SMAD4->TP53
//Handle 0 vs 1
Tags:
我准备了一个示例数据框架,基于我如何理解您的输入数据。然后您可以看到创建新数据帧所做的聚合。你知道吗
1)按大小写排序\u id,Gene
2)应用lambda连接组上唯一的排序字符串
3)应用max将二进制变量(由列掩码定义)连接到组上
4)合并两个结果
df\U最终:
相关问题 更多 >
编程相关推荐