我想对客户进行分组,并将计数为1的项目与计数大于1的项目进行匹配,如果所有项目都匹配,则将可能的合并id添加到新列中。例如:客户1,id=3,项目在id=2中,因此这是一个匹配,可分配的合并id为1,同样,对于客户2,id=7,项目在id=5项目中,所以匹配和可能的合并id是4。你知道吗
我的数据帧:
count custmr id items
3 Customer1 1 Cabbage, beet, Okra, root
3 Customer1 2 Apple, Banana, Mango ,Pears, leafs
1 Customer1 3 Mango leafs
1 Customer1 4 tomato root
4 Customer2 5 grapes,leach,guava,pappaya
2 Customer2 6 blackberry,blueberry
1 Customer2 7 pappaya
预期输出:
count custmr id items probable_merge_id
3 Customer1 1 Cabbage, beet, Okra, root
3 Customer1 2 Apple, Banana, Mango ,Pears, leafs
1 Customer1 3 Mango leafs 2
1 Customer1 4 tomato root
4 Customer2 5 grapes,leach,guava,pappaya
2 Customer2 6 blackberry,blueberry
1 Customer2 7 pappaya 4
首先按
merge
创建交叉联接,按count=1
筛选,将字符串转换为set
,以便进行比较。上次为map
创建Series
:相关问题 更多 >
编程相关推荐