嗨,所有我有一个数据帧的内容将是
name,mv_str
abc,Exorsist part1
abc,doc str 2D
abc,doc str 3D
abc,doc str QA
abc,doc flash
def,plastic
def,plastic income
def,doc str 2D ###i added this row for better clarity
我预期的o/p应该是。。。。从某种意义上说,每个组获得唯一的记录行——对于每个mailid mv_str不应该是相似的类型i:e来自一个“mv_str”的前2个单词不应该出现在第2行/任何一行中。在
注意:应根据用户名级别进行比较。在
^{pr2}$请任何人帮助我形成逻辑,否则代码示例将是很大的帮助。谢谢。在
我认为您需要在} 字符串,然后创建新的
mv_str
列中首先使用^{DataFrame
df1
:按^{} 添加原始
^{pr2}$DataFrame
df
:然后^{} 通过
name
、0
和1
列,第一个值仍然存在:按^{} 删除列
0
、1
、2
:或者最好只选择
name
和mv_str
列来删除列:相关问题 更多 >
编程相关推荐