文档指纹生成器

fingerprint的Python项目详细描述


#指纹–文档指纹生成器

##文件的指纹 指纹是文件的签名。尤其是,它是文档的所有哈希值集合中哈希值的代表子集。有关更多详细信息,请考虑查看[筛选:文档指纹的本地算法](http://theory.stanford.edu/~aiken/publications/papers/sigmod03.pdf(特别是图2)

##超级简单易用 指纹很容易使用。 `python f = Fingerprint(kgram_len=4, window_len=5, base=10, modulo=1000) print f.generate(str="adorunrunrunadorunrun") print f.generate(fpath="/Users/test/docs/CHANGES.txt") ` 参数的默认值是 `python kgram_len = 50 window_len = 100 base = 101 modulo = sys.maxint `

##安装 `sh pip install fingerprint `

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
来自控制器的java集合引用应用程序?   java无法插入到swagger 2.0文档中常见错误代码的html链接   循环中的java输入不匹配异常   java Spring批处理集成运行并行作业的远程分区   在Android中使用Gson在自定义类的ArrayList中读取java   C++规范化图像描述符OpenCV-java   java Andmore的Android软件包生成器失败,错误与sun/misc/BASE64Encoder相关   如何用java从多部分数据格式创建接收代码   java用文件填充数组   分页如何在Java代码中实现下一步按钮单击?   我们能用泛型参数动态调用Java接口方法吗?   java从另一个项目中定义的类调用静态方法需要为这两个项目添加库   反射:运行时类型信息是否存储在java中?   编写一个Java程序,允许用户输入自己的公式并进行计算   java Tomcat多个webapps文件夹   java比较两个xml文件并向第一个xml文件添加新标记   反射我能用正则表达式在java中找到类的方法吗?