对于Python中的大型数据集,如何使用经度和纬度查找最近的位置?

2024-10-02 12:31:04 发布

您现在位置:Python中文网/ 问答频道 /正文

我有一个熊猫数据框,包含500.000(!)行(位置)和两列:

  • 经度
  • 纬度

现在我想要第三列:

  • 最近的位置

此列应告诉我哪一行/位置距离“当前”行/位置最近

我知道您可以使用例如cdistfrom scipy.spatial.distance找到两个lon/lat之间的距离。但是,这需要花费太多时间,因为它必须在数据集中循环500.000*500.000次(因为它试图找到每个位置到每个位置的距离)

有人知道如何处理这个问题吗


Tags: 数据距离时间scipyspatialdistance花费lon

热门问题