我的df中有一列,我需要从中删除区分大小写的重复项,保留第一次出现。问题是,在某些行上,单词之间可能有“,”分隔或包含“-”。有没有一种方法可以在保留顺序的同时清理这些数据
this is how my data looks like
3sprouts Cesto de Roupa Cisne Sprouts, 3Sprouts, Organizador
Bright-Starts Mordedor Chocalho Rattle & Teethe, bright Starts, Rosa/Roxo
Bright-Starts Mordedor Twist & Teethe, Starts, Multicor
#this is how it should look like
3sprouts Cesto de Roupa Cisne, Organizador
Bright-Starts Mordedor Chocalho Rattle & Teethe, Rosa/Roxo
Bright-Starts Mordedor Twist & Teethe, Multicor
非常感谢
假设:
-
李>一些想法:
.lower()
比较李>-
则拆分单词,然后剥离,
进行比较应打印:
与答案相比,它有点不同,但我仍然不明白为什么第1行中也删除了
Sprouts
('3sprouts'匹配'sprouts'?)没关系。。。请给出一些概念
仅供参考
尝试:
df
的输出:相关问题 更多 >
编程相关推荐