快速纯Python实现的k-means

2024-05-18 22:13:39 发布

您现在位置:Python中文网/ 问答频道 /正文

我想在谷歌应用程序引擎应用程序(为谷歌玻璃构建)上做k-均值聚类。appengine只接受纯Python库。在

我尝试过使用SciPy的kmeanskmeans2来使用py_vq而不是{}的C实现,但是它们在大约500000 x,y,z点上花费了太长时间(~100秒),我在App Engine日志中得到了一个DeadlineExceededError。在

为了节省内存限制,我已经将样本大小减少了90%,所以我想避免再减少样本量。在

有没有什么纯pythonk-means库对googleappengine来说足够快?在


Tags: py引擎app应用程序聚类scipyengine均值
2条回答

如果出现死线异常错误,请考虑使用后端。后端没有截止时间和可配置的内存限制(虽然不是很高,最大1GB)。在

参见:https://developers.google.com/appengine/docs/python/backends/

好吧,C实现肯定比纯python实现更快。。。 对于数字方面的东西,纯python可能非常昂贵和缓慢。这就是为什么像numpy和scipy这样的python库在后端有很多用更快的语言实现的东西。在

您也可以尝试限制迭代次数。经过10次迭代后的k均值结果可能与实践中的最终结果一样好。这是第一次迭代,情况会发生很大变化。在

相关问题 更多 >

    热门问题