我有一个包含两列的数据集,如下所示。。。在
InteractorA InteractorB
AGAP028204 AGAP005846
AGAP028204 AGAP003428
AGAP028200 AGAP011124
AGAP028200 AGAP004335
AGAP028200 AGAP011356
AGAP028194 AGAP008414
我用的是Pandas,我想删除两次出现的行,但简单地颠倒如下。。。从这个。。。在
^{pr2}$为了这个。。。在
InteractorA InteractorB
AGAP002741 AGAP008026
因为他们的意图和目的都是一样的。在
有没有内置的方法来处理这个问题?在
这是我为自己的目的所做的最干净的解决方案。在
创建一个列,将每一行合并到一个已排序的列表中
无法删除列表上的重复项,因此该列应为字符串
^{pr2}$删除重复项
我认为以下方法可行:
因此,我下载了您的数据,误解了您的需求,因此以下内容将起作用:
^{pr2}$现在,我们希望获得重复的行,但取第一个值:
现在连接两个数据帧:
我认为这是正确的。在
最后,我编写了一个hacky脚本,它遍历行和必要的数据片段,并检查是否出现了concatenate,或者是否出现了它的反向,并根据需要删除了行索引。在
2017年编辑:几年过去了,有了更多的经验,这是一个更优雅的解决方案,任何人寻找类似的东西:
^{pr2}$相关问题 更多 >
编程相关推荐