Pandas在多个索引中删除重复行为

2024-10-01 17:34:29 发布

您现在位置:Python中文网/ 问答频道 /正文

我在drop_duplicates函数中观察到一些有趣的行为。它倾向于删除比它应该删除的更多的行。请参阅下面的示例,该方法通过datadf删除非重复项,但通过较小的dataframe保留它:

testdf = datadf.loc['2013-09']

In[228]: datadf.drop_duplicates().loc['2013-09-04']
Out[228]: 
id        RXZ13
close    137.75
Name: 2013-09-04 00:00:00, dtype: object

In[229]: testdf.drop_duplicates().loc['2013-09-04']
Out[229]: 
            id close 
date
2013-09-04 RXU13 139.73
2013-09-04 RXZ13 137.75

datadf.describe显示8762个计数,testdf.describe只显示28个计数。在


Tags: 函数inid示例close请参阅outloc

热门问题