Python中的地理空间分析

2条回答

网友

1楼 · 编辑于 2024-09-28 15:31:36

在Python中，我将查看GeoPandas。它提供了一个名为GeoDataFrame的数据结构：它是一个特性列表，每个特性都有一个几何体和一些可选属性。可以基于几何体相交将两个geodataframe连接在一起，并且可以在单个几何体（例如，邮政编码）内聚合行数（例如，行程）。在

我不熟悉Uber的数据，但我会设法把它放入GeoPandas GeoDataFrame中。在
同样地，邮政编码也可以从美国人口普查、OpenStreetMap[1]等地方下载，并强制输入到地理数据框中。在
根据几何相交将#1连接到#2。您需要一个新的地理数据框架，每次Uber旅行都有一行，但每行都附有邮政编码。Another StackOverflow post discusses how do to this，而且它现在比它应该的更难。在
按邮政编码汇总，并统计每一次旅行的次数。代码看起来像joined_dataframe.groupby('postcode').count()。在

我对上述过程的担心是，如果你有几十万个非常复杂的旅行几何图形，在一台机器上可能要花上一辈子的时间。你发布的链接使用的是Spark，你可能最终还是想把它并行化。您可以针对Spark集群编写Python（！）但我不是帮你做这个部件的人。在

最后，对于预测组件（例如SGD），请查看scikit-learn:这是一个功能非常齐全的机器学习包，有一个非常简单的API。在

[1]：有一个单独的包geopandas_osm，它获取osm数据并返回GeoDataFrame:https://michelleful.github.io/code-blog/2015/04/27/osm-data/

网友

2楼 · 编辑于 2024-09-28 15:31:36

我知道这是一个老问题，但要建立在杰夫·G的答案上。在

如果您来到这个页面寻求帮助，在python中组合一套地理空间分析工具-我强烈推荐本教程。在

它在第三节真的很火。在

它展示了如何整合

再加上scikit learn、numpy和scipy，你真的可以完成很多。您也可以从这个nDarray tutorial获取信息