高性能持久花过滤器
Hydra的Python项目详细描述
[![生成状态](https://travis-ci.org/crankycoder/hydra.svg?branch=master)](https://travis-ci.org/crankycoder/hydra)
Python花过滤器。
使用cython 0.24或更高版本编译。
-
hydra是一种高性能的bloom过滤器。基本上是一个港口 卡桑德拉布鲁姆过滤器与一些有趣的cython黑客。
1)使用内存映射IO是持久的。在linux上,mmap使用 map_populate标志,以便将整个文件加载到内核空间 虚拟内存。换句话说-快。
2)hash函数使用murrushash3算法,因此 快速且具有优异的密钥分配和雪崩特性。
3)过滤器导出一个类似集合的接口。使用.add(..,.contains() 或者使用“in”运算符。
- 测试。天哪,没有检查的人怎么了?
过滤器支持定期强制同步到磁盘,使用 fdatasync(),或者您可以让deallocator刷新所有内容 当筛选器超出作用域或进程终止时使用磁盘。
九头蛇是多头蛇。他们也是坏家伙 他们胸前有蛇的标志,经常试图打败尼克·弗瑞。 现在它是一个花过滤器。
大多数情况下,我不忍心再把这个叫做pysomelibraryname 图书馆。
生成、安装开发程序生成和测试:
$ pip install -r requirements.txt $ cythonize src/_hydra.pyx $ python setup.py develop $ python setup.py test