技术公开课实录:端到端预训练应用工具PaddleHub深度解析

原创
2019/12/28 19:15
阅读数 55

导读:飞桨PaddlePaddle)致力于让深度学习技术的创新与应用更简单。为了让更多的开发者了解飞桨的最近技术进展,特别组织了系列技术稿件,视频来源于2019 WaveSummit秋季深度学习开发者峰会上的技术公开课。

本期是由百度飞桨资深研发工程师为大家带来端到端预训练应用工具PaddleHub深度解析,敬请观看。

 

视频关键知识点Notes:

01

整体介绍

PaddleHub飞桨平台下端到端的预训练模型管理平台,并提供迁移学习工具。PaddleHub官方目前支持了70多个预训练模型,覆盖了文本和视觉两个领域。

PaddleHub的设计理念为模型即软件,通过命令行工具搜索预训练模型,也可以一键进行下载,并具备版本的管理。开发者可以基于非常简单的代码自己做词法分析、人像抠图的小程序或视频级别的分割等等,通过API快速集成到相应的任务当中,这便是模型即软件的开发理念。

02

PaddleHub主要特点

2.1.丰富的预训练模型库

飞桨的预训练模型库,目前主要覆盖自然语言处理和计算机视觉两个方向,包含图像分类、目标检测、词法分析、语义模型、情感分析、语言模型、视频分类、图像生成、图像分割等70多个技术领先的而且经过长期的产业实践验证的优质模型,可以帮助开发者快速开始。

2.2.少量代码即可完成迁移学习

PaddleHub Fine-tune API的开发,目的是帮助开发者降低迁移学习的门槛。在预训练模型的领域,我们可以认为模型都是标准化的,有标准化的输入,也有标准化的输出,跟软件是样的模块化。通过自定义数据集,再加上Fine-tune API,组网的工作可以通过一行代码搞定,而且PaddleHub集成了工业级简单实用的策略,包括数据的预处理等,可供开发者尝试。同时,引入『模型即软件』的设计理念,通过Python API或者命令行实现一键预测,更方便地应用飞桨模型库。

2.3.支持超参优化,自动搜索超参数

PaddleHub AutoDL Finetuner提供一个黑盒优化的策略,目标是用尽可能少的次数来找到一个更好的超参,使得我们的模型在验证集上的指标更好。这个问题没有很明确的公式描述,因此需要通过黑盒优化的技术来求解:通过定义一个超参的类型和范围,让机器来自动搜索,而且对于任意的机器学习的代码都可以使用黑盒优化,可以帮助开发者提高整个超参优化的效率。

2.4.通过HubServing,实现一键Module服务化部署。

Hub Serving是为用户端到端体验打造的,从预训练模型快速的生成API的服务,可以实现安全可控、支持私有化的部署。开发者可以基于PaddleHub开放的模型在自己的企业内部搭建起预训练模型和服务,并通过API调用的方式快速接入。客户端的应用方式非常简单,通过我们最经典的HTTP的方式,可以快速的使用这些预训练模型,让更多的人能够用到预训练模型的效果。

更多内容,请参考:

https://github.com/PaddlePaddle/PaddleHub

03

未来计划

PaddleHub还在持续快速迭代当中,将来会进一步优化超参搜索框架,开放出更多小、灵、快的预训练模型和垂类场景如法律或者金融等等。也会开放让开发者建设并贡献预训练模型。以及与Paddle Lite全面的打通,支持移动端的预训练模型进行更好的迁移学习。最后在HubServing会形成一个弹性调动的功能,让企业应用方面更加方便强大。

进入网盘获取视频中的PPT,链接:

https://pan.baidu.com/s/1XlheJQKjjbsv2_NDQWSdhg     密码:d4aw

想与更多的深度学习开发者交流,请加入飞桨官方QQ群:796771754。

如果您想详细了解更多飞桨PaddlePaddle的相关内容,请参阅以下文档。

官网地址:

https://www.paddlepaddle.org.cn/hub

项目地址:

https://github.com/PaddlePaddle/PaddleHub

 

本文分享 CSDN - 飞桨PaddlePaddle。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中

作者的其它热门文章

打赏
0
0 收藏
分享
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部