我有一个数据集,它有一个带有相应数据的唯一ID列表,但是一些唯一ID有多行
我试图做的是删除所有具有相同唯一ID的行,如果其中任何一行包含特定值的单个/多个实例
示例DF:
ID % Trump Adj
abc123 0.833 Moron
xyz987 0.87 Loser
abc123 0.867 Puppet
abc123 0.812 Incompentent
hij456 0.812 Moron
lmn789 0.837 Senile
lmn789 0.856 Opposite of Obama
lmn789 0.813 Embarrassing
我想删除'Trump Adj'列中包含'Moron'的任何行以及共享相同ID的任何其他行
结果数据框:
ID % Trump Adj
xyz987 0.87 Loser
lmn789 0.837 Senile
lmn789 0.856 Opposite of Obama
lmn789 0.813 Embarrassing
任何帮助或指导都会非常有帮助,如果需要进一步澄清,请告诉我
使用
str.contains
和布尔掩码:解释
首先,查找包含单词
'Moron'
的列:然后,找到唯一的
ID
,它们的形容词包含Moron
:最后,找到在我们刚刚创建的列表中
'ID'
不是的所有行:这给了我们想要的结果
您可以将索引设置为
ID
,然后使用drop
:如果需要,还可以在此之后重置索引,以将
ID
作为列返回:相关问题 更多 >
编程相关推荐