文本图像增强器:用于文本识别的数据生成器
textaug的Python项目详细描述
Text-Image-Augmentor
为了安装韩文图像识别数据,增强数据库
目的OCR 텍스트 인식 모델을 개발할 때, 필요한 학습 데이터셋 수를 늘리기 위한 목적으로 개발
概要
增强数据大致分为两种歪曲方式。一种是对文字形态进行变形的形象歪曲方式,另一种是对文字和背景的颜色进行变形的色彩歪曲方式。字体形象比颜色,受到形象的影响更多。因此,该库以文字的形态转换为主,构成了应用于图像。
由**CLI环境(comand line interface)*构成,由研究人员和开发者们容易使用而组成,在现场演唱中,以增强形象的库之一imgaug《eem》为基础制作的。
安装“h3”-
在
pypi中安装包裹
pip install textaug
- cation:目前还没有在pypi发布。Test code完成后,将分发。
-
从
Repository安装
# 해당 디렉토리로부터 다운받은 후, 아래를 실행시키면 됩니다. python3 setup.py install
使用方法
该程序可在Comment Line Interface(Terminal,CMD,shell)等环境中运行。
example
textaug <input_dir> <output_dir> --multiples=3执行
以上代码,input_dir
将我的图像文件装入,output_dir
中存储增强图像。如果说{output_dir
中随机增加了3个图像(ex 0再见.png,1再见.png,2再见.png)。
Option
以下元素用于决定增强图像的噪声水平。请通过以下规定所需水平。
--multiples
:决定每个图像生成多少个增强图像,输入整数型。--blur
:决定图像模糊的水平。每个值的模糊程度如下。blur=0 blur=2 blur=4 blur = 6 blur=8 --noise
:决定图像背景的噪声水平。对每个价格的噪声如下。noise=0 noise=1 noise=20 noise=30 noise=40 --rotate
:决定图像的旋转转换水平。每个值的转换程度如下。rotate=0 rotate=2 rotate=4 rotate=6 rotate=8 --shear
:决定图像的前期转换水平。每个值的转换程度如下。shear=0 shear=2 shear=4 shear=6 shear=8 ^{
}:决定图像的Elastic转换水平。每个值的转换程度如下。 elastic=0 elastic=1 elastic=2 elastic=3 elastic=4
Copyright 2019,NIA(韩国信息化振兴院),All rights reserved。
- 项目
标签: