Pandas function.apply()未传递参数“ValueError:点坐标必须是有限的。(nan,nan,0.0)已作为坐标传递。”

2024-10-01 09:19:28 发布

您现在位置:Python中文网/ 问答频道 /正文

Python大师 我正在尝试使用pandas.apply()函数来加速我的代码。 然而,我面临着一个我不知道如何解决的问题。
该脚本的主要目标是在数据帧上循环,并确定地图上两个点之间的距离。为此,我使用geopy库并构建了以下函数:

def distance_2points(lat1, long1, lat2, long2):
    coord1 = (lat1, long1)
    coord2 = (lat2, long2)
    results = distance.distance(coord1, coord2).km
    return results

当我测试函数时,它不会出现任何问题,但当我尝试将它与.apply()一起使用时,我得到

ValueError:点坐标必须是有限的。(nan,nan,0.0)已作为坐标传递。

完整代码

from geopy import distance
import pandas as pd
from datetime import datetime
import time
startTime = datetime.now()
print(datetime.now() - startTime)
lat1 = 40.067982
long1 = -75.056641
def distance_2points(lat1, long1, lat2, long2):
    coord1 = (lat1, long1)
    coord2 = (lat2, long2)
    results = distance.distance(coord1, coord2).km
    return results
df = pd.read_csv('data.csv')
df['distance'] = df.apply(lambda row: distance_2points(lat1, long1, lat2=row['lat'], long2=row['long'] ), axis=1)
print(datetime.now() - startTime)

谁能解释一下是什么问题吗

数据示例 https://docs.google.com/spreadsheets/d/11sahfFQcv_PcODUvFxe6ziY_TeBjDkfLCpf2baqEKck/edit?usp=sharing


Tags: importdfdatetimeresultsnowrowdistanceapply
1条回答
网友
1楼 · 发布于 2024-10-01 09:19:28

试试这个:

from geopy import distance
import pandas as pd
from datetime import datetime
import time

startTime = datetime.now()
print(datetime.now() - startTime)
lat1 = 40.067982
long1 = -75.056641

def distance_2points(row):
    coord1 = (lat1, long1)
    coord2 = (row['lat'], row['long'])
    results = distance.distance(coord1, coord2).km
    return results

df = pd.read_csv('data.csv')
df['distance'] = df.apply(lambda row: distance_2points(row), axis=1)
print(datetime.now() - startTime)

事实上,您可以通过直接将命名函数应用于数据帧而不使用lambda来进一步简化此过程:

df['distance'] = df.apply(distance_2points, axis=1)

相关问题 更多 >