MLDatasetBuilder是一个python包,它有助于为ML数据集准备图像。

MLDatasetBuilder的Python项目详细描述


MLDatasetBuilder

MLDatasetBuilder-Version 1.0.0—一个Python包,用于为机器学习构建数据集 每当我们开始一个机器学习项目时,我们首先需要的是一个数据集。数据集将是培训模型的支柱。您可以自动或手动生成数据集。MLDatasetBuilder是一个python包,它有助于为ML数据集准备图像。在

python versionPyPIDownloadsDownloads

Author:卡瑟夫纳加拉扬

电子邮件karthick965938@gmail.com

安装

我们可以使用这个命令安装MLDatasetBuilder

pip install MLDatasetBuilder

如何测试?

在终端中运行python3时,它将产生如下输出:

^{pr2}$

运行以下代码可以获得MLDatasetBuilder包的Initialize进程输出。在

>>> from MLDatasetBuilder import *
>>> MLDatasetBuilder()

package_sample_output

可用操作

  1. PrepareImage - 删除不需要的格式图像并重命名图像
#PrepareImage(folder_name, image_name)
PrepareImage('images', 'dog')
  1. ExtractImages - 从视频文件中提取图像
#ExtractImages(video_path, file_name, frame_size)
ExtractImages('video.mp4', 'frame', 10)#OR#ExtractImages(video_path, filename)
ExtractImages('video.mp4', 'frame')#Default FPS will be 5

步骤1 - 从谷歌获取图片

是的,我们可以从谷歌获取图片。{我们可以很容易地在几分钟内得到图像。您可以查看here获取有关此扩展的更多详细信息!在

step_1

步骤2 - 创建Python文件

一旦使用这个扩展名下载了图像,就可以创建一个名为^{str1}的python文件$测试.py与下面的目录相同。在

download_image_folder/
   _14e839ba-9691-11ea-a968-2ed746e9a968.jpg
   5e5f7af12600004018b602c0.jpeg
   A471529_Alice_b-1.jpg
   image1.png
   image2.png
   ...
test.py

在images文件夹中,您可以看到许多png图像和随机文件名。在

步骤3 - 准备图像

MLDatasetBuilder提供了一个名为PrepareImage的方法。使用此方法,我们可以删除不需要的图像,并重命名已从浏览器扩展下载的图像文件。在

PrepareImage(folder_name, image_name)#PrepareImage('images', 'dog')

根据上面的代码,我们需要提到图像文件夹的路径和类名。在

step_1

完成该过程后,您的图像文件夹结构如下所示

download_image_folder/
   dog_0.jpg
   dog_1.jpg
   dog_2.jpg
   dog_3.png
   dog_4.png
   ...
test.py

这个过程非常有助于在添加标签时对图像进行注释。当然,这将是一个标准化的东西。在

步骤4 - ExtractImage

MLDatasetBuilder还提供了一个名为ExtractImages的方法。利用这种方法我们可以从视频文件中提取图像。在

download_image_folder/
video.mp4
test.py

根据下面的代码,我们需要提到视频路径、文件夹名称和帧大小。Folder name是类名和framesize的默认值5,它不是必需的。在

ExtractImages(video_path, folder_name, framesize)#ExtractImages('video.mp4', 'frame', 10)
ExtractImages(video_path, folder_name)#ExtractImages('video.mp4', 'frame')

step_1

完成该过程后,您的图像文件夹结构如下所示

download_image_folder/
dog/
   dog_0.jpg
   dog_1.jpg
   dog_2.jpg
   dog_3.png
   dog_4.png
   ...
dog.mp4
test.py

贡献

欢迎所有问题和拉请求!要在本地运行代码,请先分叉存储库,然后在计算机上运行以下命令:

git clone https://github.com/<your-username>/ML-Dataset-Builder.git
cd ML-Dataset-Builder
# Recommended creating a virtual environment before the next step
pip3 install -r requirements.txt

在添加代码时,一定要在必要时编写单元测试。在

联系人

MLDatasetBuilder由Karthick Nagarajan创建。随时联系Twitter或通过Email!

欢迎加入QQ群-->: 979659372 Python中文网_新手群

推荐PyPI第三方库


热门话题
我可以用C++代码使用java代码吗?   java使用JSR303在派生类中提供更具体的约束   java在这个查找唯一路径数算法中我做错了什么?   java如何为2个不同的服务提供商使用2个不同的SSL证书?   java在Gridview上绘制文本   java使用连接for循环构建字符串名   java StringBuilder拆分无法处理某些文件   java事件关注EditText   Java Web Start“找不到URL的缓存资源”   java程序从命令行运行的速度比在Eclipse中慢   java为什么HttpServletRequest会截断#字符上的url输入?   java自定义折叠工具栏平滑标题大小调整   使用Mockito对安卓 java中调用另一个静态函数的函数进行单元测试   http在java客户机中使用cachecontrol头   java如何使用。是否使用Delimiter从输入文件中排除标点符号和数字?   使用上下文作为参数/参数的java   java更有效地从Jar中提取文件   java为多个JButton提供相同的actionListener