用于场景识别的gist图像描述符

pyleargist的Python项目详细描述


Author:<olivier.grisel@ensta.org>

用于计算用于比较图片的gist全局图像描述符的库 基于它们的内容(用于全局场景识别和分类)。

gist图像描述符理论定义可以在a.torralba的 页码:http://people.csail.mit.edu/torralba/code/spatialenvelope/

c实现的源代码包含在lear_gist 子文件夹。原始项目见http://lear.inrialpes.fr/software 信息。

pyleargist是根据gpl授权的,与原始c 项目。

安装

安装带有开发头(http://www.fftw.org)的libfftw3,python dev headers、gcc、python映像库(pil)和numpy。

本地生成以进行测试:

% python setup.py buid_ext -i
% export PYTHONPATH=`pwd`/src

在系统范围内构建和安装:

% python setup.py build
% sudo python setup.py install

用法

下面是安装库后python shell中的一个示例会话:

>>> from PIL import Image
>>> import leargist

>>> im = Image.open('lear_gist/ar.ppm')
>>> descriptors = leargist.color_gist(im)

>>> descriptors.shape
(960,)

>>> descriptors.dtype
dtype('float32')

>>> descriptors[:4]
array([ 0.05786307,  0.19255637,  0.09331483,  0.06622448], dtype=float32)

gist描述符(默认为固定大小960)可以用作 欧几里得空间根据图像内容对其进行聚类。

然后,可以使用 局部敏感哈希,谱哈希或叠加去噪自编码器。

文中给出了一个用sdas实现图片语义哈希的例子。 libsgd库:http://code.oliviergrisel.name/libsgd

更改

  • 1.1.0:2010/03/25-修复分段错误错误,thx到s.campion
  • 1.0.1:2009/10/10-添加缺少的清单
  • 1.0.0:2009/10/10-首次发布

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java解析一个文本文件,如果内容是一种特定的格式,就打印它   java如何使jbutton在另一个组件中执行键盘笔划   连接到独立帐户的java Stripe   java在数据库连接过程中出错。。。初始连接   一个系列JavaFX中特定节点的java集样式   java重建recycler视图会导致它消失   在codechef上提交java Getting runtime(NZEC)时出错   Java类路径设置错误   java如何显示数组中2个数字之间的信息?   java为什么新的GC只有很长的用户时间?   如何解决java。关于此代码的lang.OutOfMemoryError   通过应用程序在Facebook粉丝页面上发布java帖子   java Red5服务器无法启动   系统输出Java读取文本文件外置行   java整数。Parse对excel获取的字符串抛出NumberFormatException   有一个Java数组列表;如何按每个数组的最后一个元素排序?   java需要txt文件中的数据(以逗号分隔)来用现有类中的对象填充arraylist