MLDatasetBuilder是一个python包,它有助于为ML数据集准备图像。
MLDatasetBuilder的Python项目详细描述
MLDatasetBuilder
MLDatasetBuilder-Version 1.0.0—一个Python包,用于为机器学习构建数据集 每当我们开始一个机器学习项目时,我们首先需要的是一个数据集。数据集将是培训模型的支柱。您可以自动或手动生成数据集。MLDatasetBuilder是一个python包,它有助于为ML数据集准备图像。在
Author:卡瑟夫纳加拉扬
安装
我们可以使用这个命令安装MLDatasetBuilder包
pip install MLDatasetBuilder
如何测试?
在终端中运行python3时,它将产生如下输出:
^{pr2}$运行以下代码可以获得MLDatasetBuilder包的Initialize进程输出。在
>>> from MLDatasetBuilder import *
>>> MLDatasetBuilder()
可用操作
- PrepareImage - 删除不需要的格式图像并重命名图像
#PrepareImage(folder_name, image_name) PrepareImage('images', 'dog')
- ExtractImages - 从视频文件中提取图像
#ExtractImages(video_path, file_name, frame_size) ExtractImages('video.mp4', 'frame', 10)#OR#ExtractImages(video_path, filename) ExtractImages('video.mp4', 'frame')#Default FPS will be 5
步骤1 - 从谷歌获取图片
是的,我们可以从谷歌获取图片。{我们可以很容易地在几分钟内得到图像。您可以查看here获取有关此扩展的更多详细信息!在
步骤2 - 创建Python文件
一旦使用这个扩展名下载了图像,就可以创建一个名为^{str1}的python文件$测试.py与下面的目录相同。在
download_image_folder/ _14e839ba-9691-11ea-a968-2ed746e9a968.jpg 5e5f7af12600004018b602c0.jpeg A471529_Alice_b-1.jpg image1.png image2.png ... test.py
在images文件夹中,您可以看到许多png图像和随机文件名。在
步骤3 - 准备图像
MLDatasetBuilder提供了一个名为PrepareImage的方法。使用此方法,我们可以删除不需要的图像,并重命名已从浏览器扩展下载的图像文件。在
PrepareImage(folder_name, image_name)#PrepareImage('images', 'dog')
根据上面的代码,我们需要提到图像文件夹的路径和类名。在
完成该过程后,您的图像文件夹结构如下所示
download_image_folder/ dog_0.jpg dog_1.jpg dog_2.jpg dog_3.png dog_4.png ... test.py
这个过程非常有助于在添加标签时对图像进行注释。当然,这将是一个标准化的东西。在
步骤4 - ExtractImage
MLDatasetBuilder还提供了一个名为ExtractImages的方法。利用这种方法我们可以从视频文件中提取图像。在
download_image_folder/ video.mp4 test.py
根据下面的代码,我们需要提到视频路径、文件夹名称和帧大小。Folder name是类名和framesize的默认值5,它不是必需的。在
ExtractImages(video_path, folder_name, framesize)#ExtractImages('video.mp4', 'frame', 10) ExtractImages(video_path, folder_name)#ExtractImages('video.mp4', 'frame')
完成该过程后,您的图像文件夹结构如下所示
download_image_folder/ dog/ dog_0.jpg dog_1.jpg dog_2.jpg dog_3.png dog_4.png ... dog.mp4 test.py
贡献
欢迎所有问题和拉请求!要在本地运行代码,请先分叉存储库,然后在计算机上运行以下命令:
git clone https://github.com/<your-username>/ML-Dataset-Builder.git cd ML-Dataset-Builder # Recommended creating a virtual environment before the next step pip3 install -r requirements.txt
在添加代码时,一定要在必要时编写单元测试。在
联系人
MLDatasetBuilder由Karthick Nagarajan创建。随时联系Twitter或通过Email!
- 项目
标签: