技术公开课实录:图像分割库PaddleSeg深度解析与应用

原创
2019/12/18 21:02
阅读数 219

导读:飞桨PaddlePaddle)致力于让深度学习技术的创新与应用更简单。为了让更多的开发者了解飞桨的最近技术进展,特别组织了系列技术稿件,视频来源于2019 WaveSummit秋季深度学习开发者峰会上的技术公开课。

本期是由百度飞桨资深研发工程师为大家带来图像分割库PaddleSeg深度解析与应用,敬请观看。

视频关键知识点Notes:

PaddleSeg四个特点:一是丰富的数据增强;二是模块化的设计;三是在高性能优化;四是工业级部署。

01

丰富的数据增强

PaddleSeg提供10余种数据增强的策略,有效的训练数据,大幅度提升模型的鲁棒性,开发者可以根据实际的场景进行灵活组合,根据实际场景进行选用,让整个分割模型应用泛化能力更强。

02

模块化的设计

整个PaddleSeg开发套件都是模块化设计的,无论是数据增强模块里面的多种增强算法,主干网络的多种Backbone模块选择,都可以让开发者更好的根据实际业务场景需求使用。分割网络包含了目前的4种主流网络:医疗领域常见的U-Net,经典的DeepLabV3,面向实时场景的分割模型ICNet等。同时对于损失函数的模块化设计,也可以更好的提升各个分类场景下的分割精度,例如小目标分割的效果。

03

高性能

PaddleSeg在性能优化方面开展了很多工作。包括训练速度提升、GPU利用率提升以及显存性能优化。同时支持较新的FP16混合精度的训练。特别的,对于动态的Loss Scaling,在不损失精度的情况下,性能可以有30%的提升。PaddleSeg在英伟达特斯拉V100卡上,单卡训练速度是对标产品的2.3倍,多卡上是对标产品的3.1倍。

04

工业级部署

根据产业的需求,PaddleSeg开发了高性能的C++预测库。在多线程计算优化、算子硬件加速方面,而且依托于真实的项目实践验证做了大量优化工作,真正满足工业级部署需求。

 

05

应用场景和案例介绍

5.1电池隔膜产品质检任务

此任务的挑战是,分割目标非常小、类别不均匀、预测性能要求高,不能拖慢流水线的速度。通过PaddleSeg实现方案最终IoU做到了0.82。预测速度在200×200的图上小于2.5毫秒,保证生产效率不会受影响。

 

5.2工业精密零件质检智能分拣

选用了ICNet,在800×800、1000×1000的大图分割速度约25毫秒,误收率小于0.1%,对比其他框架速度快20%左右。

 

5.3人像分割

PaddleSeg开放了人像分割的预训练模型,mIoU可以做到0.93,适用于证件照片、人像特效、替换照片视频背景等分割任务。

  

06

后续规划

PaddleSeg后续开放方向:一是视频级别分割,做到如人体特效、天空分割、实时的语义分割等;二是图像分割解决方案。三是高性能的端侧部署,与PaddleSlim打通,支持模型压缩,并与Paddle Lite整合,让开发者能够更方便的部署到端上。

进入网盘获取视频中的PPT,链接:

https://pan.baidu.com/s/1Kg_nymkE8RC92JdW87fZAw    密码:9nw6

想与更多的深度学习开发者交流,请加入飞桨官方QQ群:796771754。

如果您想详细了解更多飞桨PaddlePaddle的相关内容,请参阅以下文档。

官网地址:https://www.paddlepaddle.org.cn

项目地址:

https://github.com/PaddlePaddle/PaddleSeg

本文分享 CSDN - 飞桨PaddlePaddle。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部