用于场景识别的gist图像描述符
pyleargist的Python项目详细描述
Author: | <olivier.grisel@ensta.org> |
---|
用于计算用于比较图片的gist全局图像描述符的库 基于它们的内容(用于全局场景识别和分类)。
gist图像描述符理论定义可以在a.torralba的 页码:http://people.csail.mit.edu/torralba/code/spatialenvelope/
c实现的源代码包含在lear_gist 子文件夹。原始项目见http://lear.inrialpes.fr/software 信息。
pyleargist是根据gpl授权的,与原始c 项目。
安装
安装带有开发头(http://www.fftw.org)的libfftw3,python dev headers、gcc、python映像库(pil)和numpy。
本地生成以进行测试:
% python setup.py buid_ext -i % export PYTHONPATH=`pwd`/src
在系统范围内构建和安装:
% python setup.py build % sudo python setup.py install
用法
下面是安装库后python shell中的一个示例会话:
>>> from PIL import Image >>> import leargist >>> im = Image.open('lear_gist/ar.ppm') >>> descriptors = leargist.color_gist(im) >>> descriptors.shape (960,) >>> descriptors.dtype dtype('float32') >>> descriptors[:4] array([ 0.05786307, 0.19255637, 0.09331483, 0.06622448], dtype=float32)
gist描述符(默认为固定大小960)可以用作 欧几里得空间根据图像内容对其进行聚类。
然后,可以使用 局部敏感哈希,谱哈希或叠加去噪自编码器。
文中给出了一个用sdas实现图片语义哈希的例子。 libsgd库:http://code.oliviergrisel.name/libsgd
更改
- 1.1.0:2010/03/25-修复分段错误错误,thx到s.campion
- 1.0.1:2009/10/10-添加缺少的清单
- 1.0.0:2009/10/10-首次发布