文档章节

懒人综合症患者福利——我整理了10篇机器学习和数据科学的好文,不要错过

天天天蓝321
 天天天蓝321
发布于 2017/07/10 16:00
字数 1804
阅读 4
收藏 0

作者 | Flavian Hautbois

翻译 | AI科技大本营(rgznai100)

参与 | JeyZhang,波波

 

上个月,我们发了很多文章。但是,机器学习和数据科学整个领域所发表的新文章更多。如何用一篇文章就能梳理好这些最新的内容呢?我们苦思冥想,从中找出了这十篇有关神经网络、TensorFlow、数据可视化、生成式对抗网络(GAN)以及LSTM的最佳文章。只此一篇,你就能把握住机器学习和数据科学整个领域的新内容,绝对不容错过。

 

如果你的阅读习惯是边看边动手做,请一定先备好Python环境。

 

我们先从下面的漫画开始:

图片翻译:

“这个问题已经困扰我们很多年了。”

“不用纠结,让我用算法来替你解决它。”

6个月后…

“哇,你这问题确实好难。”“你不是说……”

 

➤1 —  Dash入门

Dash提供了一套全新的用于web的图表库,而这篇文章深入介绍了Dash图表库是如何设计的,以及介绍了在Dash中如何有效地处理常见错误以及多重集成。文章中对Excel和R语言系统进行了很合理的对比。使用Dash进行图表实现时,一个技术上的挑战是,你需要维护一个flask应用以及拥有一个对ReactJS友好的前端。

 

Adil Baaj在我们的博客上发布了一篇对比多种javascript图表库的文章。如果希望入门Dash,可以阅读来自plotly的《Dash入门》。

 

 

➤2 —  Google发布用于目标检测的TensorFlow API

 

Google公司一直致力于让大数据领域最新研究的实现变得更加简单。本月他们在TensorFlow上发布了用于目标检测的API,也发布了适用于移动设备的版本。

 

详见Google Research Blog的原文

 

➤3  — 初识生成式对抗网络(Generative Adversarial Networks, GAN)

 

 

这是一篇介绍如何训练一个神经网络来生成手写数字图片的教程。我们很欣赏这种在对抗式网络这个新的研究方向上的实践技术,这又是一个在经典MNIST数据集上做的实验。在这篇文章中,你将得知训练生成式对抗网络是一件困难的事,是因为你需要在生成器与判别器的训练中找到平衡。本教程仅需要大概半小时就能读完,属同类教程中的佼佼者。

 

详见O’Reilly原文

 

➤4  —  使用深度学习技术重构出高分辨率的音频

 

 

受到最近图像方面研究的启发,文章作者尝试用低质量的音频文件来重构出分辨率更高的音频,最终音频质量上没有取得大幅度的提高,但也一定程度上达到了目的。尽管实验结果上的提升并不显著,我们仍然认为该篇文章为本月最佳文章之一。原因如下:

 

  • 本文着重于重构VoIP语音,这点很巧妙。

  • 语音方面的研究工作比较复杂,而深度学习技术的应用除了在语音转文本应用领域之外,其他的较少见到。

 

我们觉得如果作者在卷积网络中使用频谱表示而不是时间表示的话,实验结果还能再提升一步。

 

详见Insight Data原文

 

➤5  —  探索LSTM

 

我们破例收录了这篇文章(发表时间在5月30日,严格上说不是6月份的文章),因为文章写得特别好。这篇文章的前半部分是一个LSTM教程,后半部分深入浅出对LSTM作了详解。详解部分使得本文非常有价值。审计 (Audit) 仍然是大数据算法中最困难的部分。正因如此,Edwin Chen做的可视化工具非常棒,因为它详细解析了LSTM的原理。

 

详见AI科技大本营的完整译文:多图|入门必看:万字长文带你轻松了解LSTM全貌

 

➤6  —  怎样训练神经网络来自动写代码?

 

 

如果你阅读了前面关于LSTM的文章,那么你已经看到了一个关于生成Java程序的例子。来自Thibault Neveu的这篇文章也在尝试做同样的事情。文中使用TensorFlow并且比之前的文章更易于上手,并且更适合做快速阅读。

 

详见AI科技大本营的完整译文:手把手教你自制编程AI:训练2小时,RNN就能写自己的代码

 

➤7  —  人工智能让制药业再创辉煌以及所面临的挑战

 

 

这篇文章介绍了如何使用生成式对抗网络来生成新的抗癌药物,思路很棒。在制药研究领域有一个Eroom定律,与摩尔定律正相反(随着时间推移,寻找新药的难度呈指数增长)。Mostapha Benhenda强烈呼吁研究人员在大数据与药理学交叉领域上的研究采取行动。

 

详见Hackernoon原文

 

➤8  —  你所不知道的图表展示小技巧

 

 

注意到上面饼状图里一些奇怪的地方了吗?你应该注意到,不过你可能没有(至少我没)。这篇文章详细举例说明了用图表来做比较时的错误用法,从中你会学到在对比两种相似的数据时,图表展示的方式非常重要。

 

详见Andrew Gelman的原文

 

➤9 — 我在Kaggle上获胜的小技巧

 

Kaggle是一个数据科学方面在线竞赛平台。公司可以提交赛题以及相关数据集供参赛者解决。Kaggle是一个大型社区,你在上面有机会获得百万美金大奖。这篇文章的作者分享了他从开始时的新手到后来比赛取得第五名的经验。我们认为他总结的参赛小技巧也可供企业数据科学家参考,如果你想参与Kaggle上的竞赛,那么这篇文章将非常值得一读。

 

详见Dataquest原文

 

➤10 — 大数据的体现:Amazon收购全食超市的交易

 

 

最后再介绍一篇关于商业上Amazon收购Whole Foods超市的文章。随着大数据的研究逐渐渗透商界,我们认为这类文章是这个列表的重要补充。从企业获取数据的角度来看,Amazon收购Whole Foods超市是明智之举。因为Amazon虽然是个大公司,但是数量上远不及Whole Foods超市多,所以收购将为其带来巨大的数据财富。

 

详见Dataiku

 

对于我们选出来的本月十佳文章,你都有看过吗?你心里有没有其他更好的选项?欢迎在评论中告诉我们,如果你们喜欢,咱们下期再见。

 

原文链接

© 著作权归作者所有

共有 人打赏支持
天天天蓝321
粉丝 4
博文 2
码字总数 7361
作品 0
关于深度学习,这里有一份入门公开课(文末福利)

点击图片购书 参与文末话题讨论,每日赠送异步图书 ——异步小编 前不久,“逃犯看张学友演唱会被抓”的新闻让不少人都感慨,原来演唱会还能用来干这个!其实这都是AI面部识别技术的功劳,在...

异步社区
06/05
0
0
程序员精选:TensorFlow和ML前5名的课程

如果你对人工智能、数据科学和机器学习感到好奇,那么我相信你已经听说过Google的机器学习API ——TensorFlow,他们已经用它来为Google搜索开发Rank Brain算法。TensorFlow是最受欢迎的机器学...

【方向】
08/25
0
0
《我不是药神》30亿票房后分析徐峥的选角眼光

01 前言 前段时间向往的生活第二季中,托尼何老师给山争大叔洗头那一幕,着实给节目赚足了笑点。 而最近徐峥凭借《我不是药神》在电影院也收了不少观众眼泪,在这部电影里面他颠覆了当初囧系...

R语言中文社区
08/09
0
0
老而弥坚,75岁美国医疗集团的 AI 转型之路

Providence St. Joseph Health(普罗维登斯·圣约瑟夫医疗集团)已经证明,人工智能和机器学习技术可以对当今的医疗服务产生重要影响。该医疗集团总部位于华盛顿州,在阿拉斯加州、华盛顿州、...

李雨晨
06/29
0
0
其实你很棒丨看唐氏症孩子如何帮助别人

今天,对于平常人来说,可能只是个普通的日子,而对于世界各地的唐氏综合症患者而言,却是个不同寻常的日子。   2011年联合国大会正式将3月21日命名为“世界唐氏综合症日”,意在寓意唐氏患...

东方启音
03/22
0
0

没有更多内容

加载失败,请刷新页面

加载更多

负载均衡的解决方案有哪些

负载均衡器服务可满足大型组织的需求,支持所有数据中心和跨数据中心高可靠性场景。 本地负载均衡,通过附带或者未附带持久性覆盖选项,Incapsula支持各种负载均衡算法,以优化服务器之间的流...

上树的熊
24分钟前
3
0
Java实现在线打开word文档加盖印章/盖章/签名功能

前言: 我们知道,大型一点的OA办公系统都会有很多在线处理office办公文档的需求。其中有一点也基本绕不开,那就是为文档盖章或添加手写签名来保护文档,让被盖章的文档不再被编辑。 在Java中...

山里的红杏
32分钟前
5
0
js控制输入正负数,小数点后保留两位

//限制数字function clearNoNum(obj){ //修复第一个字符是小数点 的情况. if(obj.value !=''&& obj.value.substr(0,1) == '.'){ obj.value=""; } obj.value ...

一直在成长的程序猿
35分钟前
2
0
动态代理

具体场景 为了使代理类与被代理类对第三方有相同的函数,代理类与被代理类一般实现一个公共的interface,定义如下 public interface Subject { void rent(); void hello(String s)...

wuyiyi
38分钟前
2
0
时间字段

我们看看这几个数据库中(mysql、oracle和sqlserver)如何表示时间 mysql数据库:它们分别是 date、datetime、time、timestamp和year。date :“yyyy-mm-dd”格式表示的日期值 time :“hh:...

DemonsI
40分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部