从ImageNet synset批量下载所有缩略图,并具有可选的重新缩放
imagenetscraper的Python项目详细描述
用于从ImageNet下载所有缩略图的命令行实用程序 synset,可选地重新缩放到不同的分辨率。
用法
Usage: imagenetscraper [OPTIONS] SYNSET_ID [OUTPUT_DIR] Options: -c, --concurrency INTEGER Number of concurrent downloads (default: 8). -s, --size WIDTH,HEIGHT If specified, images will be rescaled to the given size. -q, --quiet Suppress progress output. -h, --help Show this message and exit. --version Show the version and exit.
如果synset页面的url看起来像:
http://image-net.org/synset?wnid=n00000000 ^^^^^^^^^ SYNSET_ID
SYNSET_ID是n00000000部分。例如,对于“人, 个人,某人,某人,凡人,灵魂 http://image-net.org/synset?wnid=n00007846,对应的synset id是 n00007846。
默认输出目录(OUTPUT_DIR)是当前目录。
示例
要将上述synset中的所有缩略图图像下载到 “个人图像”目录,运行:
imagenetscraper n00007846 person_images
执行相同的操作,但将每个缩略图的宽度重新调整为256,然后 高度128,加--size 256,128:
imagenetscraper n00007846 person_images --size 256,128
要在“安静模式”下运行,抑制进度输出,请添加--quiet:
imagenetscraper n00007846 person_images --size 256,128 --quiet
默认情况下,imagenetscraper将一次下载8个图像。若要更改此项,请使用 --concurrency:
imagenetscraper n00007846 person_images --size 256,128 --concurrency 4
安装
安装python 3、pip和libjpeg的开发版本。图像浏览器 使用python 3.4-3.7和libjpeg turbo 8进行测试。
sudo apt-get install python3 python3-pip libjpeg-turbo8-dev
下载并安装带有pip的imagenetscraper。
sudo -H pip3 install imagenetscraper
引文
如果此工具有助于您的研究,我们将不胜感激:
@Misc{imagenetscraper, author = {Michael Smith}, title = {imagenetscraper: Bulk-download thumbnails from ImageNet synsets}, howpublished = {\url{https://github.com/spinda/imagenetscraper}}, year = {2017} }
测试
要运行单元测试,请使用:
python3 setup.py test
许可证
版权所有(c)2017-2018 Michael Smith<;michael@spinda.net>;
此程序是免费软件:您可以在 自由党公布的GNU Affero通用公共许可条款 软件基础,许可证的版本3,或(由您选择)任何 更高版本。
这个程序的发布是希望它能有用,但是没有 任何保证;甚至没有对适销性或适用性的暗示保证 为了特定的目的。更多信息请参见GNU Affero通用公共许可证 细节。
你应该收到一份gnu-affero通用公共许可证 用这个程序。如果没有,请参见<;http://www.gnu.org/licenses/>;。