螃蟹的基准是(http://www.slideshare.net/marcelcaraciolo/crab-a-python-framework-for-building-recommender-systems第37页)
Benchmarks Pure Python w/ Python w/ Scipy dataset dicts and NumpyMovieLens 100k 15.32 s 9.56 s http://www.grouplens.org/node/73 Old Crab New Crab
但是,在我的情况下,我需要30多分钟才能完成,我不知道原因
我的代码是
^{pr2}$我的数据是NumpyMovieLens 100k,它包含了1700部电影的1000个用户的100000个收视率。在
我上一次看Crab是在一年多前,它使用的是密集数组,如果它应该使用sparse matrices(例如^{} )。这使得它的速度非常慢,同时也让人记忆犹新。我只是匆匆瞥了一眼,螃蟹好像已经有一年没有更新了,所以情况可能还是一样的。在
螃蟹正在重新设计。数据操作将更加有效,并且更少地依赖于外部lib。API本身将被简化。我们想尽快发布一个稳定的版本,这样社区就可以参与进来了。目标是创建一个框架来填补Python中的这一空白。项目托管在这里https://github.com/python-recsys/crab。在
欢迎提供帮助和建议。在
相关问题 更多 >
编程相关推荐