擅长:python、mysql、java
<p>现在,您可以使用scikit learn的DBSCAN和haversine度量对空间经纬度数据进行聚类,而无需使用scipy预计算距离矩阵。</p>
<pre><code>db = DBSCAN(eps=2/6371., min_samples=5, algorithm='ball_tree', metric='haversine').fit(np.radians(coordinates))
</code></pre>
<p>这是关于<strong><a href="http://geoffboeing.com/2014/08/clustering-to-reduce-spatial-data-set-size/" rel="nofollow">clustering spatial data with scikit-learn DBSCAN</a></strong>的教程。特别是,注意<code>eps</code>值是2km除以6371(地球半径单位为km)将其转换为弧度。另外,请注意,<code>.fit()</code>采用haversine度量的弧度单位坐标。</p>