用于构建和使用计算机视觉数据集的实用程序

xt-cvdata的Python项目详细描述


xt cvdata公司

说明

此repo包含用于构建和使用由Xtract AI开发的计算机视觉数据集的实用程序。在

到目前为止,包括以下开源数据集的API:

  1. COCO 2017(检测和分割):xt_cvdata.apis.COCO
  2. 打开图像V5(检测和分割):xt_cvdata.apis.OpenImages
  3. 可视化对象标记工具(VoTT)CSV输出(检测):xt_cvdata.apis.VoTTCSV

还有更多。在

安装

来自PyPI:

pip install xt-cvdata

来源:

^{pr2}$

使用

使用help查看数据集类的特定帮助。E、 g.,help(xt_cvdata.apis.COCO)。在

构建数据集

fromxt_cvdata.apisimportCOCO,OpenImages# Build an object populated with the COCO image list, categories, and annotationscoco=COCO('/nasty/data/common/COCO_2017')print(coco)print(coco.class_distribution)# Same for Open Imagesoi=OpenImages('/nasty/data/common/open_images_v5')print(oi)print(coco.class_distribution)# Get just the person classescoco.subset(['person'])oi.subset(['Person']).rename({'Person':'person'})# Merge and buildmerged=coco.merge(oi)merged.build('./data/new_dataset_dir')

这个包遵循pytorch链接规则,这意味着操作对象的方法会就地修改它,但也会返回修改后的对象。例外的是merge()方法,它不会就地修改并返回一个新的合并对象。因此,上述操作也可以使用以下方法完成:

fromxt_cvdata.apisimportCOCO,OpenImagesmerged=(COCO('/nasty/data/common/COCO_2017').subset(['person']).merge(OpenImages('/nasty/data/common/COCO_2017').subset(['Person']).rename({'Person':'person'})))merged.build('./data/new_dataset_dir')

实际上,在这两种方法之间的某个地方可能是最可读的。在

当前的数据集操作集包括:

  • analyze:重新计算数据集统计信息(例如,类分布、train/val分割)
  • verify_schema:检查类属性是否遵循所需的模式
  • subset:从数据集中除去类的一个子集
  • rename:重命名/组合数据集类
  • sample:从训练集和验证集中抽取指定数量的图像
  • split:定义验证集中的数据比例
  • merge:将两个数据集合并在一起,返回合并的数据集
  • build:使用符号链接或复制图像创建当前定义的数据集

实现新的数据集类型

新的数据集类型应该从基xt_cvdata.Builder类继承。请参阅BuilderCOCOOpenImages类作为指南。具体地说,类初始值设定项应该定义infolicensescategoriesannotations和{}属性,这样self.verify_schema()运行时不会出错。这可以确保在Builder类中定义的所有方法都能在继承类上正确操作。在

数据源

[数据说明和链接]

依赖关系/许可

[依赖项及其许可证的列表,包括数据]

参考文献

[参考文献列表]

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
java如何从用户输入中找到最大值和最小值?(while循环)   java数据库资源异常   java hibernate查询速度太慢,是否忽略了延迟加载条件?   不带花括号的java IfElse控制流   nextInt()中十进制数输入的java检查   java根据REST中的资源类型发送不同的响应主体   JAVAutil。扫描器Java系统。争论中   对于单个条目,java XSLT到数组的转换失败   java将txt文档预处理为以字符串为键、整数ArrayList为值的hashmap   java获取泛型数组类类型的简单方法?   雅加达ee使用Fast Purge Open API通过java代码清除akamai中的缓存URL   java在OpenNLP中使用parseLine解析后,如何获得没有空格的名词短语作为输入句子?   设置与my GUI的自动交互之间的延迟(Java Swing)