如何在python中检查地理空间的相似性?是地球帆更好还是Pandas更好?

2024-10-01 15:44:59 发布

您现在位置:Python中文网/ 问答频道 /正文

假设我有两个熊猫数据帧,格式类似于这个,每个点代表一个人和他们所在的位置。假设有多个线字符串表示在特定路径中行走的不同的人。我想根据这两天的步行流量,比较一天和另一天之间是否存在“相似性”(例如,基于可以设置的偏差参数)

Name, Latitude, Longitude, Date
Jordan,<lat>,<lon>, 2017-08-01T00:00:05
Jordan,<lat>,<lon>, 2017-08-01T00:00:08
Jordan,<lat>,<lon>, 2017-08-01T00:00:10
Jordan,<lat>,<lon>, 2017-08-01T00:00:16 
Sarah,<lat>,<lon>, 2017-08-01T00:00:20
Sarah,<lat>,<lon>, 2017-08-01T00:00:30
Jordan,<lat>,<lon>, 2017-08-01T00:00:32

我使用shapely来构建路径/线条,表示每个人在给定的日期和时间所处的位置

如何生成线条

dayonegeom = [Point(ab) for ab in zip(dayonedataframe.longitude, daytwodataframe.latitude)]

dayonegeodataframe = GeoDataFrame(dayonedataframe, geometry=dayonegeom)
daytwogeodataframe = GeoDataFrame(dayonetwoframe, geometry=daytwogeom)

对我来说,过滤dataframe或GeoDataFrame的最佳方法是什么,这样就只保留彼此最“相似”的路径,而消除不相似的路径

寻找实现这一点的最佳方法,可以是在数据转换为地理数据帧之前使用pandas,也可以是在数据转换之后使用geopandas


Tags: 数据方法路径ab格式代表线条lon

热门问题