Dataframe列在列表中包含字符串值。Dataframe需要转换为在“Final”列中具有唯一列表的行
我的数据框架如下所示
string1 string2 Final
1 [abc,ncx] [qwe, rty] [apple, mango]
2 [uio,pas,dfg] [zxc,vbg,dfv] [banana,grapes, apple]
3 [ncx,abc] [rty,qwe] [mango,apple]
4 [uio,pas,dfg] [zxc,vbg,dfv] [banana,grapes, apple]
5 [uio,dfg] [zxc,dfv] [banana, apple]
6 [ncx,abc] [rty,qwe] [mango,apple]
df['final']列必须删除重复列表,并将数据帧转换为在'final'列中包含唯一列表
所需输出数据帧:
string1 string2 Final
1 [abc,ncx] [qwe, rty] [apple, mango]
2 [uio,pas,dfg] [zxc,vbg,dfv] [banana,grapes, apple]
3 [ncx,abc] [rty,qwe] [mango,apple]
4 [uio,dfg] [zxc,dfv] [banana, apple]
通过^{} 创建的} 中进行筛选:
~
反转掩码,但由于list
不可散列,请首先将它们转换为元组并在^{如果
apple, mango
与mango, apple
重复(顺序不重要),则将tuple
更改为frozenset
:相关问题 更多 >
编程相关推荐