Python中文
首页
教程
问答
标签
搜索
登录
注册
使用pandas查找不同组之间的重复行
回答此问题可获得
20
贡献值,回答如果被采纳可获得
50
分。
<h2>问题</h2> <P>考虑下面的数据文件:</P> <pre class="lang-py prettyprint-override"><code>data_so = { 'ID': [100, 100, 100, 200, 200, 300, 300, 300], 'letter': ['A','B','A','C','D','E','D','A'], } df_so = pandas.DataFrame (data_so, columns = ['ID', 'letter']) </code></pre> <p><a href="https://i.stack.imgur.com/yXaU7.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/yXaU7.png" alt="enter image description here"/></a></p> <p>我想获得一个新列,其中不同组中的所有重复项均为真。同一组中的所有其他重复项都应为False</p> <h2>我试过的</h2> <p>我试过使用</p> <pre class="lang-py prettyprint-override"><code>df_so['dup'] = df_so.duplicated(subset=['letter'], keep=False) </code></pre> <p>但结果不是我想要的:</p> <p><a href="https://i.stack.imgur.com/aAf86.png" rel="nofollow noreferrer"><img src="https://i.stack.imgur.com/aAf86.png" alt="enter image description here"/></a></p> <p>组1(第0行)中第一次出现的是<code>True</code>,因为另一个组(第7行)中存在重复项。但是,在同一组(第2行)中,所有其他<em>的</em>A发生率应为<code>False</code></p> <p>如果删除了第7行,那么第0行应该是<code>False</code>,因为在任何其他组中都不再存在</p>
0 条评论
分类:
Python问答
请先
登录
后评论
默认排序
时间排序
1 个回答
匿名
1天前
擅长:python、mysql、java
<p>我对这个问题的看法是:</p> <pre><code>import datatable as dt df = dt.Frame(df_so) df[:1, :, dt.by("ID", "letter")] </code></pre> <p>我将按ID和字母列进行分组。然后简单地选择第一行</p>
请先
登录
后评论
针对此问题:
更多的回答
关注
89
关注
收藏
1
收藏,
216
浏览
网友 提问于 2天前
相关Python问题
如何在乒乓球比赛中预测球的轨迹,对于AI球拍预测?
6 回答
如何在乒乓球游戏中阻止球
5 回答
如何在乘法和模中不乘空间?
5 回答
如何在乘法和除以2个不同的数字之间进行交换?
9 回答
如何在也是数据一部分的单个字符上拆分大字符串
1 回答
如何在乾草堆中找到針,有更好的解決方案嗎?
10 回答
如何在事件wxWidgets中传递自定义数据
8 回答
如何在事件中使用lambda i=i?
3 回答
如何在事件中心只接收最近的数据
5 回答
如何在事件发生之前保持云函数运行?
3 回答
如何在事件发生后使页面重定向到同一页面
8 回答
如何在事件回调之间保持python生成器的状态
2 回答
如何在事件处理程序(pythonsocket、sphinx)中保留docstring
7 回答
如何在事件处理程序中更改wxRichTextCtrl的光标位置?
9 回答
如何在事件处理程序中访问外部对象?
9 回答
如何在事件循环中将协程打包为正常函数?
1 回答
如何在事件循环之外运行协同程序?
1 回答
如何在事件循环结束时为并发未来的所有线程调用类方法?
9 回答
如何在事件文件中只保留一份摘要?
7 回答
如何在事件模板中添加事件
1 回答