从第一本书开始,如何成为深度学习工程师(上篇)

原创
2018/06/22 14:32
阅读数 50

在这里,小编理解的初阶选手,是具备了一定的计算机基础,但是对于深度学习理论和动手实操方面没接触过的筒子。通过系统学习后能够快速入门,并升级中阶。

如下是建议初阶少侠的修仙路径,需要走好这四步,即:

读理论书→看视频课→实操训练→社区交流

具体怎么操作呢?别着急,逐一来看~


要看的第一本书


基础理论习得的最直接来源就是书本。按机器学习理论、深度学习理论、编程语言三个方面划分,做如下书籍阅读推荐:


机器学习理论


深度学习是机器学习中的一个分支,两者内在的理论基础存在很强关联。就像一个孩子在学会走路前需要学会爬,同理在掌握深度学习理论前,需要先掌握机器学习理论。

机器学习理论的书籍教材也非常多样,这里推荐一本易懂易学的书籍,可以重点关注神经网络部分。

书名:周志华《机器学习》,清华大学出版社



深度学习理论


打好机器学习的理论功底后,可以开始钻研深度学习的理论了。通常深度学习理论会给人留下抽象难懂的印象,且和数学结合紧密。为了让大家能够开心入门not放弃,在此推荐一份超级容易读懂的教材,无论深度学习理论还是数学理论都能一本搞定~

书名: 《深度学习》,Goodfellow, Bengio, Courville合著,赵申剑、黎彧君、符天凡和李凯合译

偶尔发现的pdf链接:https://github.com/exacity/deeplearningbook-chinese



编程语言


1)Python方向

看到主推语言是Python,大家可能会好奇,为啥它中选?

一方面,各大主流深度学习框架所使用的编程语言均为Python




另一方面,对比其他语言,Python也是相当简单易学的!

Python的教材也非常多样,这里推荐一本实操和理论性都兼顾的教材,只要完成书中52个习题,跑代码然后发现问题解决,就能逐步上手

书名:《“笨办法”学Python》,作者Zed Shaw 王巍巍译,人民邮电出版社201411月版





2)C++方向

C++语言在底层框架中使用较多,在逐步掌握开源框架的基本操作后,在更高阶的框架应用中会用到这个技能点。

同前面提到的Python一样,学习C++时需要多上手操作。这里推荐迅速上手C++的书籍,不但能够学习功能和结构,还提供了解决方案的示例


书名:《Essential C++》【美】李普曼(Lippman, S. B.)著,侯捷译,电子工业出版社2013年8月版



需要看的视频公开课


在学习一门新技术的同时,除了看书,如果有老师面对面教授,可以更快更好的学会知识。线下授课一般会固定时间和地点,且需要交学费才能听。而视频公开课能够在省钱省力的同时达到同样的面授效果~


通过学习视频公开课,大家可以更轻松的理解深度学习中的抽象理论,并且也能在实操方面不绕弯路。且目前深度学习的课程多是公开免费的。


小编纵览很多课程网的深度学习公开课之后,综合课程生动性、可操作性、紧凑性、连续性这些特点,推荐如下课程,并将它们的网址一并附上,便于大家查找学习~


1)百度推出的“AI核心技术掌握“课程,每节课在20-30分钟左右,从AI技术到深度学习进行全面细致的解读。

https://ai.baidu.com/paddlepaddle/player?id=13  

2)台湾李宏毅教授的在线课程,其中是英文课程,会结合国外的科研成果,但也适合新手入门和理解深度学习

http://speech.ee.ntu.edu.tw/~tlkagk/courses_ML17_2.html

3)Python操作课程,从基础到进阶操作都提供详细说明,每节课在20分钟左右

 https://ai.baidu.com/paddlepaddle/openCourses 



初步训练


做好如此充足的知识储备和编程操作,当然不能纸上谈兵,这就带大家冲进深度学习的世界操练起来!


不过,先不要急起飞,就像王者农药初期要有角色对战教学一样,我们也需要简单的实操,检测自己的学习成果。


一般遵循的路径是:选取案例→使用框架跑模型→扩大范围实践


选取案例


做好前面的两步铺垫,接下来进入实训阶段,那么可以到哪里找到适合初阶少侠操作的案例呢?

纵观各类文章,业内人士高频推荐如下两种深度学习模型

  1. 房价预测:借助人工神经元和人工神经网络,深度学习模型可以借助多种特征预测出结果。一套房子的价格也受到很多因素影响,对应着深度学习模型中的多种特征。且目前房价的价格数据有成熟的数据库,不同的深度学习框架也都有房价模型。这就相当于烹饪,食材工具都已具备,火候也已经调好,遵循这些操作就可以成功啦。

  2. 鸢尾花分类:这个是图像分类中的经典模型。深度学习模型同样可以进行图像识别和分类,而图像分类操作上手难度相对较低。且鸢尾花有稳定的官方数据集——鸢尾花iris.csv,配合不同深度学习框架模型,以及其中给出的分类模型代码,就可以成功的让深度学习帮你区分鸢尾花啦!


问题来了:模型都需要配合深度学习框架使用,那么深度学习框架都有哪些,上哪儿找呢?

目前主流的国际化开源框架中,适合新手操作的有三种,其主要特征如下:

Tensorflow:Google出品,定位于工业级应用,跟紧技术前沿

Pytorch:定位于做研究使用,具备一定的灵活性

PaddlePaddle:百度出品,定位是成为最适合中国用户的框架,易学易用,有详细中文文档、视频课程和API。


框架安装


出于容易学习,以及小编工资谁发的因素,本篇文章中,小编就以深度学习框架PaddlePaddle为例介绍~

安装部分,建议使用linux系统,如果是windows系统需要安装虚拟机docker后再进行安装,具体的安装攻略可以参见小编之前的推送:

速成记|安装PaddlePaddle到底分几步?

安装成功后,在PaddlePaddle官网首页,就有房价预测模型,下载数据并复制代码后,就尽情的跑起来吧!详解链接在此请收好:

http://www.paddlepaddle.org/


扩大范围实践


恭喜少侠,经历初阶磨练,相信你已经有了足够的信心,有想要接触更多模型训练的冲动,享受一步步成功的快感!

如果你安装的深度学习框架是PaddlePaddle,如下链接可直达Paddle官方在Github上的模型库:

https://github.com/PaddlePaddle/models

PaddlePaddle的主站中也有部分模型可以关注

https://github.com/PaddlePaddle/Paddle


交流社区


完成上述三步,少侠已经初长成,可以向深度学习的更深度进发啦!

相信你一定迫不及待想要找到队友,在使用期间遇到安装、操作、调用文档等多方面的问题也需要解决。

可以去哪里找人聊聊呢?


如果你使用的是PaddlePaddle,恭喜你!有队伍!

可以移步到中文交流社区,发帖寻找八方支援,或分享你的成功经验,直达链接如下:

http://ai.baidu.com/forum/topic/list/168

ps目前中文社区提问,24小时内回得到有效回复哦!


如果你使用的是Tensorflow,目前也有中文社区。不过近期小编尝试数次没能打开成功,为了避免影响大家的心情,大家也可以去如下两个中文社区论坛蹲点:

CSDN:包含行业资讯和博客文章  https://www.csdn.net/

开源中国:包含博客文章和软件产品动态资讯 https://www.oschina.net/



经历 阅读理论书——观看公开课视频——初阶实操——应用实战, 踏实做好每一步,深度学习工程师的初阶修炼就完成啦!接下来请期待下一篇:深度学习工程师中阶修炼指南

欢迎在下方评论区留言交流~


PaddlePaddle是百度开发的开源深度学习框架,致力于打造最符合中国工程师需求的深度学习生态

*为了方便大家使用PaddlePaddle,遇到问题可在中文社区提问,值班同学将在24小时内响应!更有精品案例、课程提供,让大家学习使用框架,轻松无忧!直达链接:

https://ai.baidu.com/forum/topic/list/168


本文分享 CSDN - 飞桨PaddlePaddle。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中

作者的其它热门文章

打赏
0
0 收藏
分享
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部