文档指纹生成器
fingerprint的Python项目详细描述
#指纹–文档指纹生成器
##文件的指纹 指纹是文件的签名。尤其是,它是文档的所有哈希值集合中哈希值的代表子集。有关更多详细信息,请考虑查看[筛选:文档指纹的本地算法](http://theory.stanford.edu/~aiken/publications/papers/sigmod03.pdf)(特别是图2)。
##超级简单易用 指纹很容易使用。 `python f = Fingerprint(kgram_len=4, window_len=5, base=10, modulo=1000) print f.generate(str="adorunrunrunadorunrun") print f.generate(fpath="/Users/test/docs/CHANGES.txt") ` 参数的默认值是 `python kgram_len = 50 window_len = 100 base = 101 modulo = sys.maxint `
##安装 `sh pip install fingerprint `