我有一个数据帧,如下所示:
Correlations adf
FITB RF 0.984395 -5.484766
WAT SWK 0.981778 -5.465284
SWK WAT 0.981778 -5.420976
RF FITB 0.984395 -5.175268
MCO BK 0.973801 -4.919812
我想过滤索引,这样数据帧会删除任何重复的值,即使它们被置换。因此,上述数据帧将成为
Correlations adf
FITB RF 0.984395 -5.484766
WAT SWK 0.981778 -5.465284
MCO BK 0.973801 -4.919812
对于一个大的数据帧,我找不到一个有效的方法。非常感谢您的帮助!你知道吗
您可以使用
sorted
+duplicated
索引可以通过以下函数进行规范化:
在对索引上的df进行分组并选择第一次出现之前,可以将该函数应用于索引(无论如何,可以应用进一步的分组选项):
输出:
您可以利用
np.sort
+pd.DataFrame.duplicated
:或者,以类似的方式,使用
pd.MultiIndex.duplicated
:相关问题 更多 >
编程相关推荐