Python中文
首页
教程
问答
标签
搜索
登录
注册
Pandas:获取重复索引
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<p>给定一个数据帧,我想得到重复的索引,这些索引在列中没有重复的值,并查看哪些值不同。</p> <p>具体来说,我有这个数据框:</p> <pre><code>import pandas as pd wget https://www.dropbox.com/s/vmimze2g4lt4ud3/alt_exon_repeatmasker_intersect.bed alt_exon_repeatmasker = pd.read_table('alt_exon_repeatmasker_intersect.bed', header=None, index_col=3) In [74]: alt_exon_repeatmasker.index.is_unique Out[74]: False </code></pre> <p>有些指数在第9栏有重复值(这个位置的DNA重复元素的类型),我想知道每个位置的重复元素的不同类型(每个指数=一个基因组位置)。</p> <p>我想这需要一些<code>groupby</code>忍者的帮助。</p> <p>为了进一步简化,如果我们只有索引和repeat类型</p> <pre><code>genome_location1 MIR3 genome_location1 AluJb genome_location2 Tigger1 genome_location3 AT_rich </code></pre> <p>因此,输出我希望看到所有重复索引及其重复类型,如下所示:</p> <pre><code>genome_location1 MIR3 genome_location1 AluJb </code></pre> <p>编辑:添加的玩具示例</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>更快更好:</p> <pre><code>df.index.get_duplicates() </code></pre>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何用强化学习更新函数逼近中的权重?
9 回答
如何用归并排序计算倒数?
4 回答
如何用当前数据拟合正弦波?
10 回答
如何用当前页面的值填充表单?
5 回答
如何用彩色地图在2dpython直方图中勾勒出箱子的轮廓?
4 回答
如何用彩色地图给等高线标签上色?
5 回答
如何用彩色打印到控制台?
4 回答
如何用彩色条绘制2d直方图,在Python中显示第三个变量的平均值?
7 回答
如何用彩色条绘制直方图,其中的颜色应与xaxis中的值一致?
10 回答
如何用彩色贴图填充曲线和原始边之间的区域?
5 回答
如何用循环分割数组并对其应用操作?
3 回答
如何用循环创建多个子集的数据帧
2 回答
如何用循环和递归实现求和
9 回答
如何用循环填充数组?
6 回答
如何用循环当前引用的位置更新变量?
3 回答
如何用循环求这个级数的和
8 回答
如何用循环解这个方程?
9 回答
如何用循环语句逐个读取数据帧中的数据?
8 回答
如何用循环除法?(Python)
3 回答
如何用感知一致性对HSV空间进行采样
1 回答