对于位置的大型数据帧，将东距和北距快速转换为纬度和经度

v84 = Proj(proj="latlong",towgs84="0,0,0",ellps="WGS84") v36 = Proj(proj="latlong", k=0.9996012717, ellps="airy", towgs84="446.448,-125.157,542.060,0.1502,0.2470,0.8421,-20.4894") vgrid = Proj(init="world:bng") def convertLL(row): easting = row['easting'] northing = row['northing'] vlon36, vlat36 = vgrid(easting, northing, inverse=True) converted = transform(v36, v84, vlon36, vlat36) row['longitude'] = converted[0] row['latitude'] = converted[1] return row values = pd.read_csv("values.csv") values = values.apply(convertLL, axis=1)

def convertLL(easting, northing): vlon36, vlat36 = vgrid(easting, northing, inverse=True) converted = transform(v36, v84, vlon36, vlat36) row = row['longitude'] = converted[0] return row values ['longitude'] = values.apply(lambda row: convertLL(row['easting'], row['northing']), axis=1)

1条回答

网友

1楼 · 发布于 2024-07-01 08:27:30

因为主题的关系，我想我们看不见树木。如果我们看一下the docs for ^{}，你会看到：

xx (scalar or array (numpy or python)) – Input x coordinate(s).
yy (scalar or array (numpy or python)) – Input y coordinate(s).

伟大的；numpy阵列正是我们所需要的。一个pd.DataFrame可以看作是数组的字典，所以我们只需要隔离这些列并将它们传递给函数。有一个很小的catch-columns的DataFrame将是一个Series，它将被transform拒绝，所以我们只需要使用values属性。这个小例子直接等同于您最初的方法：

def vectorized_convert(df):
    vlon36, vlat36 = vgrid(df['easting'].values, 
                           df['northing'].values, 
                           inverse=True)
    converted = transform(v36, v84, vlon36, vlat36)
    df['longitude'] = converted[0]
    df['latitude'] = converted[1]
    return df

df = pd.DataFrame({'northing': [378778, 384732],
                   'easting': [366746, 364758]})

print(vectorized_convert(df))

我们完成了。除此之外，我们可以查看100行的计时（当前的方法针对我通常的100000行的计时示例）：

def current_way(df):
    df = df.apply(convertLL, axis=1)
    return df


def vectorized_convert(df):
    vlon36, vlat36 = vgrid(df['easting'].values, 
                           df['northing'].values, 
                           inverse=True)

    converted = transform(v36, v84, vlon36, vlat36)
    df['longitude'] = converted[0]
    df['latitude'] = converted[1]
    return df


df = pd.DataFrame({'northing': [378778, 384732] * 50,
                   'easting': [366746, 364758] * 50})

给出：

%timeit current_way(df)
289 ms ± 15.2 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)

%timeit vectorized_convert(df)
2.95 ms ± 59.8 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)

相关问题更多 >

编程相关推荐

热门问题

热门文章