劳伦特·沙菲博士论文实验
xbob.thesis.elshafey2014的Python项目详细描述
这个软件包包含了复制我在洛桑理工学院(EPFL)博士论文实验的脚本。 它是我在Idiap Research Institute的Biometrics group工作时开发的:
@phdthesis{ElShafey_EPFL2014, title = {Scalable Probabilistic Models for Face and Speaker Recognition}, author = {Laurent El Shafey}, month = {April}, year = {2014}, school = {Ecole Polytechnique F{\'e}d{\'e}rale de Lausanne (EPFL)}, url = {http://publications.idiap.ch/index.php/publications/show/2830}, }
特别是,这个包提供了将代码(见Bob,其中包含机器学习算法和信号处理工具的实现)和数据结合起来生成本文中描述的图的说明。
安装
要下载xbob.thesis.elshafey2014包,请转到http://pypi.python.org/pypi/xbob.thesis.elshafey2014,单击download按钮并将.zip文件解压缩到您选择的文件夹中。
elshafey2014是免费的信号处理和机器学习库Bob的卫星包,它的一些算法依赖于CSU Face Recognition Resources。 这两个依赖项必须手动下载,如下所述。
鲍勃
您需要一个版本1.2.2中bob的副本来运行算法。 请从其网页下载Bob。 下载后,您应该转到控制台并写入:
$ python bootstrap.py $ bin/buildout
这将下载所有必需的依赖项并在本地安装它们。 如果不希望下载所有数据库包,请在调用上述三个命令之前,从主目录中的文件buildout.cfg的^{t t 1}$部分删除xbob.db.[database]行。
csu人脸识别资源
CSU Face Recognition Resources算法提供了两种开源的人脸识别算法,即lrpca算法和lda-ir算法。 对于这些算法,xfacereclib.extension.CSU附属包中提供了可选的包装类。 默认情况下,此包被禁用。 要启用它们,请致电:
$ bin/buildout -c buildout-with-csu.cfg
下载并修补csu资源,并使用csu.cfg文件更新构建中的sources-dir之后–如xfacereclib.extension.CSU中所述。
数据库
在几个数据库上进行了实验。 它们应该手动下载和提取,以便能够重现这些图。
- 班卡[http://www.ee.surrey.ac.uk/CVSSP/banca]
- AR面数据库[http://www2.ece.ohio-state.edu/~aleix/ARdatabase.html]
- 人脸识别大挑战版2[http://www.nist.gov/itl/iad/ig/frgc.cfm]
- 好的,坏的,丑陋的
- 野生标记面[http://vis-www.cs.umass.edu/lfw](与漏斗对齐的图像[http://vis-www.cs.umass.edu/lfw/lfw-funneled.tgz]和注释[http://www.idiap.ch/resource/biometric/data/LFW-Annotations.tar.gz])
- 多馅饼[http://www.multipie.org]
- mobio[http://www.idiap.ch/dataset/mobio](图像、音频数据和图像注释)
- cas-peal[http://www.jdl.ac.cn/peal/index.html]
- NIST说话人识别评估2012[http://www.nist.gov/itl/iad/mig/sre12.cfm](出于培训和开发目的,需要由LDC分发的附加数据[请参见https://pypi.python.org/pypi/xbob.db.nist_sre12对数据进行预处理])
安装数据库后,应将原始数据的路径设置为某些配置文件。 例如,要在banca数据库上运行实验,应设置变量“banca_directory” 在文件banca.py中 包含此数据库的图像。 这将在完整的文档中详细解释。
运行实验
如果您已经设置了上面提到的所有内容,就可以运行识别实验了。
此过程分为两个不同的步骤:
1. Generation of raw scores from raw data (image/audio files [and possibly annotations]) of the databases 2. Generation of plots from these raw scores
在m-iris合成数据集上生成的图只有一个例外。 在这种情况下,实验不需要任何外部数据,并且可以在一个步骤中再现。 在实际应用中,第一步的计算要求很高,这取决于所考虑的数据库。
进一步阅读
文档中有几个文件链接,这些链接在联机文档中不起作用。 要在本地生成文档,请键入:
$ bin/sphinx-build docs sphinx $ firefox sphinx/index.html
并阅读有关如何使用此软件包的进一步说明。
引用我们的论文
如果你使用在您的任何实验中,请引用以下论文:
@phdthesis{ElShafey_EPFL2014, title = {Scalable Probabilistic Models for Face and Speaker Recognition}, author = {Laurent El Shafey}, month = {April}, year = {2014}, school = {Ecole Polytechnique F{\'e}d{\'e}rale de Lausanne (EPFL)}, url = {http://publications.idiap.ch/index.php/publications/show/2830}, }
问题
如果有问题,请联系我(劳伦特·沙菲)。
如果您在运行脚本时遇到技术问题 在这个包中,您可以在Bob’s mailing list上发送消息。
请跟随these guidelines 当(甚至更好的)报告任何错误时。