删除数据帧中的重复(对等)

2024-09-29 23:31:25 发布

您现在位置:Python中文网/ 问答频道 /正文

我正在尝试删除数据帧中的重复元素。此数据帧来自计算给定地理坐标列表之间的距离。正如您在下面的DataFrame中看到的,数据是重复的,但是我不能将索引设置为'dist',因为在其他情况下,距离可能是0或1(重复),然后重要的数据将被丢弃

import pandas as pd
df = pd.DataFrame({'Name_x':['a','b','c','d'],
            'Name_y':['b','a','d','c'],
            'Latitude_x':['lat_a','lat_b','lat_c','lat_d'],
            'Longitude_x':['long_a','long_b','long_c','long_d'],
            'Latitude_y':['lat_b','lat_a','lat_d','lat_c'],
            'Longitude_y':['long_b','long_a','long_d','long_c'],
            'dist':[0,0,1,1]})
df

在本例中,我希望保留值Name_x:['a','c'],Name_y['b','d']以及相应的地理坐标:lation_x:['lat_ua','lat_uc'],lation_y:['lat_ub','lat_ud'],longitu_x:['long_ua','long_uc'],longitu_y:['long_ub','long_ud']


Tags: 数据name距离dataframedfdistlongpd

热门问题