根据一些标准删除表中的行问题的回答

根据一些标准删除表中的行

回答此问题可获得 20 贡献值，回答如果被采纳可获得 50 分。

我有一个有两列的文件 <pre><code>Col1 : Cluster number Col2: Seq name </code></pre> 序列名称可以有不同的名称： 例如： <pre><code>NP_XXXXXX YP_XXXXXX AMN16433 </code></pre> 等等以及 <code>KQ976470.1:66008-66163(-):Atta_colombica</code>（<code>Name:number-number(+ or -):Name1_Name2</code>） （有很多不同的名称，但我感兴趣的是只保留至少有一个seq名称的Cluster：（<code>Name:number-number(+ or -):Name1_Name2</code>）（所以基本上我能认出他们，因为只有他们的名字里会有<code>+</code>或<code>-</code>） 因此，如果： -至少有一个seqname的名称中有<code>+</code>或<code>-</code>，并且至少有<code>one other seqname</code> 如果： -只有名称中带有<code>+</code>或<code>-</code>的seqname。 -只有另一个名字 例如： <pre><code>Cluster1 NP_075076 Cluster1 AMN16433 Cluster1 YP_063711 Cluster1 KQ976470.1:66008-66163(-):Cattus_sylvestris Cluster1 AJP07295 Cluster1 AMN15329 Cluster2 YP_00999 Cluster2 YP_00989 Cluster2 YP_00971 Cluster2 YP_00988 Cluster2 AJP07295 Cluster3 KI976478.1:66021-66123(-):Canis_lupus Cluster3 AJP07232 Cluster3 AJP07212 Cluster3 AZ976430.1:66045-66190(+):Cavia_porsellus Cluster4 AHHYUIIY Cluster5 AZ976490:66042-66190(-):Felis_porsellus Cluster5 AA976490:66021-66130(+):Felis_porsellus </code></pre> 所以我应该得到： 我删除<code>Cluster2</code>，因为没有 <pre><code>Cluster1 NP_075076 Cluster1 AMN16433 Cluster1 YP_063711 Cluster1 KQ976470.1:66008-66163(-):Cattus_sylvestris Cluster1 AJP07295 Cluster1 AMN15329 Cluster3 KI976478.1:66021-66123(-):Canis_lupus Cluster3 AJP07232 Cluster3 AJP07212 Cluster3 AZ976430.1:66045-66190(+):Cavia_porsellus </code></pre> 我删除了<code>Cluster2</code>和<code>Cluster4 because there is no seqname with either a + or a -.</code> 我删除了Cluster5，因为只有seqname带有<code>+</code>或<code>-</code>，没有其他seqname 非常感谢

0 条评论
分类：Python问答

默认排序时间排序

1 个回答

匿名 1天前

　擅长：python、mysql、java

根据一些标准删除表中的行

1 个回答

相关Python问题