张量流的计算机视觉和目标检测研究现状。
sightseer的Python项目详细描述
TensorFlow最先进的计算机视觉和目标检测。在
制造商:Rishabh Anand•https://rish-16.github.io
sightseer
提供最先进的通用体系结构(YOLOv3、MaskRCNN、Fast/Faster RCNN、SSD…)用于计算机视觉和目标检测任务,其中有30多个用TensorFlow 1.15编写的预训练模型。在
安装
sightseer
是用python3.5+和TensorFlow 1.15编写的。在
理想情况下,sightseer
应该安装在virtual environments中。如果您不熟悉Python虚拟环境,请在开始时查看tutorial。在
通过PyPi
要使用sightseer
,必须首先安装TensorFlow。为此,请按照TensorFlow installation page上的说明操作。在
{{cd6>安装时可以使用cd6}设置虚拟环境:
pip install sightseer
模型客户(截至目前)
YOLOv3Client
(达克内特作者:约瑟夫·雷德曼)
Facebook AI's Mask R-CNN will be out in the v1.2.0 release. For more information on model release, check out the Roadmap.
sightseer
的组件
该软件包附带4个主要组件,帮助处理对象检测过程的不同部分,从准备原始数据到获取预测并显示它们。在
Component | Description |
---|---|
Sightseer | Obtains image data or video footage |
Proc | Provides image/frame-wise annotation and inter-format conversion tools |
Zoo | Stores the wrappers over all state-of-the-art models and configs |
Serve | Provides deployment and model serving protocols and services |
如果不使用自定义数据集,Sightseer
和Zoo
是主要用于预训练模型的一般预测的子模块。当涉及到自定义数据时,可以使用Proc
对数据集进行注释,甚至可以在XML/JSON/CSV/TFRecord格式之间进行转换。在
Serve
is an experimental productionising submodule that helps deploy your models on cloud services like AWS and GCP. For more details on future tools and services, check out the Roadmap.
特点
镜头或原始图像可以使用Sightseer
在被摄取到模型或进一步预处理之前进行渲染。在
1a。正在加载图像
^{pr2}$1b。正在加载视频
fromsightseerimportSightseerss=Sightseer()frames=ss.load_vidsource("path/to/video")# returns nested array of frames
Support for video, webcam footage, and screen recording will be out in the coming v1.2.0 release.
2。使用sightseer.zoo
一旦安装,sightseer
提供的任何模型都可以在不到10行代码中访问。例如,使用YOLOv3(Darknet)模型的代码如下:
fromsightseerimportSightseerfromsightseer.zooimportYOLOv3Clientyolo=YOLOv3Client()yolo.load_model()# downloads weights# loading image from local systemss=Sightseer()image=ss.load_image("./assets/road.jpg")# getting labels, confidence scores, and bounding box datapreds,pred_img=yolo.predict(image,return_img=True)ss.render_image(pred_img)
要在视频帧上运行模型,可以使用framewise_predict
方法:
fromsightseerimportSightseerfromsightseer.zooimportYOLOv3Clientyolo=YOLOv3Client()yolo.load_model()# downloads weights# loading video from local systemss=Sightseer()frames=ss.load_vidsource("./assets/video.mp4")"""For best results, run on a GPU"""# getting labels, confidence scores, and bounding box datapreds,pred_frames=yolo.framewise_predict(frames)ss.render_footage(pred_frames)# plays the video and saves the footage
甚至可以使用^{
贡献
欢迎提出建议、改进和改进!如果您有任何问题,请在问题部分提出一个问题。如果你有改进,一定要在创建公关之前提交一个问题来讨论这个建议
所有的想法-无论多么离谱-欢迎!在
在提交之前,请检查Roadmap,看看提议的特性是否已经在开发中。在
Note: Please commit all changes to the
development
experimentation branch instead ofmaster
.
许可证
- 项目
标签: