我有一个熊猫数据帧,ds。我想从一个名为'Name'的特定列中删除重复条目。你知道吗
+---------+------+-------+----------+--------+
| Invoice | Name | Price | Date | Coupon |
+---------+------+-------+----------+--------+
| 123412 | Jim | 50 | 12/01/17 | ALBB1 |
| 431311 | Jane | 25 | 12/02/17 | BB2 |
| 134123 | Joe | 70 | 12/03/17 | BB2 |
| 333131 | Jim | 85 | 12/04/17 | ALBB1 |
+---------+------+-------+----------+--------+
这是我的密码:
ds = ds.drop_duplicates(subset='Name', keep='first')
我使用keep='first'
选项来保留在dataframe中找到的第一个实例。你知道吗
我想做的是从所有丢弃的条目中创建一个单独的数据帧。你知道吗
所以,在这个例子中。第二个数据帧ds2等于:
+---------+------+-------+----------+--------+
| Invoice | Name | Price | Date | Coupon |
+---------+------+-------+----------+--------+
| 333131 | Jim | 85 | 01/04/18 | ALBB1 |
+---------+------+-------+----------+--------+
对布尔掩码使用^{} ,并按^{} 过滤。你知道吗
注意:
keep='first'
应该省略,因为默认值此布尔掩码可用于生成
DataFrame
,而~
用于反转布尔掩码:细节:
编辑:
也可以使用
keep='last'
来提取没有最后一个的所有重复,或者使用keep=False
来提取所有重复值:相关问题 更多 >
编程相关推荐