python的cpp中的simhash模块
pysimhash的Python项目详细描述
simhash
用于python的simhash cpp模块,是simhash的cpp实现,支持128位等大尺寸
安装
pip install pysimhash
或从github.com安装
git clone https://github.com/skiloop/simhash
cd simhash
python setup.py install
要求
- 增强python
基准
在Intel(R)Core(TM)i5-4590 CPU@3.30GHz x86_64 UbuntuLinux上创建并比较(使用benchmark.py)100000个simhash值,结果如下
implement | time |
---|---|
pure python | 11148.62 s |
pysimhash | 2392.36 s |