文档章节

唇读、生成式对抗网络、自动音乐生成都是些什么鬼?且看人工智能年度科技盘点(提供PDF干货下载)

云栖运营小编
 云栖运营小编
发布于 2017/01/23 17:38
字数 1475
阅读 154
收藏 0

2016年机器学习领域取得了很多可以铭记在历史中的进展,将其称为”机器学习元年”也并不为过。市场上各大公司都在进行机器学习的研究,即使没有,他们也通过收购各类机器学习初创公司来快速进入这个领域。

99f79370c3b19a2bb5256d53bb94799c5e5d55ee

造就这一轮机器学习的热潮的原因很多。虽然Google开源Tensorflow框架才过去短短一年,Tensorflow已然成为Github上最为炙手可热的项目,使用场景横跨从药物研发到自动音乐生成等各个领域。Google并不是唯一开源了机器学习基本框架的科技巨头,微软的CNTK,百度的PaddlePaddle都是目前被广泛使用的机器学习框架。Amazon虽然没有自己研发的机器学习框架,但他们已经宣布将在未来支持MXNet,以期推广他们最新的AWS ML平台。而Facebook目前主要支持两个深度学习平台:Torch以及Caffe。Google本身也同时在支持在学术和工业界都取得重大成功的机器学习框架Keras。在这个意义上来说,在AI的这场技术”军备大战”中,Google与Facebook算是打成了平手。

除了各大技术公司争相开源自己的机器学习框架,2016年也见证了无数优质的机器学习的应用,这些工作即使放到几个月前都是不可想象的。

我特别印象深刻的是Wavenet的音频生成的质量。过去我曾经处理过类似的问题,对比之下对于那些他们所完成的结果我很欣赏。我也要强调一些最近在唇读方面的成就,一个伟大的视频识别的应用,在不久的将来可能是非常有用的(也许是可怕的)。 我还应该提到谷歌在机器翻译方面取得的令人印象深刻的进步。看到这一领域在一年内有这么大进步真是令人惊讶。

事实上,机器翻译并不是我们在过去一年中在机器学习在自然语言技术领域看到的唯一有价值的进步。 通过结合深度序列神经网络以及语言相关的一些信息,我们可以生成一些更为丰富的语言模型。 例如在“A Neural Knowledge Language Model”这篇论文中,Bengio的团队将知识图谱与RNN相结合,而在“Contextual LSTM models for Large scale NLP Tasks”的论文中,Deepmind团队将文章的主题提取同时纳入到LSTM模型。 此外,我们还看到了许多在建模语言模型的attention和memory(这两个词在学术方面有专门的含义,解释成注意力和记忆也没错,但是总觉得有点不太对)方面的有趣工作。 作为一个例子,我推荐在今年的ICML(国际机器学习大会)中发表的论文“Ask Me Anything: Dynamic Memory Networks for NLP”。

此外,我还想要提及一些发表于2016年在巴塞罗那举行的NIPS上的工作。遗憾的是,我错过了这次在我的家乡举行的会议。从我了解的内容来看,两个最热门的话题可能是生成式对抗网络(包括Ian Goodfellow的非常受欢迎的教程)和结合概率模型的深度学习相关的课题。

另外我也想谈一下机器学习在我的主要专业领域,推荐系统方面的一些进步。 毫无疑问,深度学习也深刻影响了这一领域。 虽然我个人仍然不建议将DL作为推荐系统的默认方法,但看它如何在实际工作中大规模的使用是很有趣的,例如通过像Youtube这样的产品我们可以看到DL对比传统的方法上还是取得了一定进展(这里有一篇Google的paper https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf)。 也就是说,在该领域还是有一些有趣的研究与深度学习无关。 例如今年ACM Recsys的最佳论文奖颁给了“Local Item-Item Models For Top-N Recommendation”,这篇工作主要是针对稀疏线性方法(即SLIM)的一个有趣扩展,通过增加一个初始化非监督聚类的步骤提升效果。 此外,“Field-aware Factorization Machines for CTR Prediction”主要详细解释了在Kaggle上的Criteo CTR预测挑战赛中的获胜算法,我们不得不正视在推荐领域,Factorization Machine仍然是你的ML工具包中非常实用的一个工具。

我可以继续在接下来的段落中列举出机器学习在过去12个月里取得的有影响力的进步。例如与图像识别或者深度强化学习相关的突破,一些重要的可应用场景包括自动驾驶汽车,聊天机器人或游戏对战,这些领域在2016年都获得了巨大的进步。此外还有各类关于机器学习如何具有或可能对社会有负面影响的争论,以及关于算法偏差和公平性的讨论的兴起。

阅读全文直接点击:http://click.aliyun.com/m/9704/

© 著作权归作者所有

云栖运营小编
粉丝 7
博文 98
码字总数 52676
作品 0
朝阳
运营/编辑
私信 提问
AI做不了“真”3D图像?试试Google的新生成模型

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/84849674 编译 | 若名 出品 | AI科技大本营 用 AI 生成逼真三维物体模型并...

AI科技大本营
2018/12/05
0
0
2017年里,哪十篇 arXiv 机器学习论文在 Twitter 上最热门?

雷锋网 AI 科技评论按:随着 2017 年结束、2018 年开始,各个媒体和研究者都撰写了各自的年度总结和新年祝愿。在过去一年的论文动态里,除了研究者们在总结文里根据自己的研究兴趣选出论文回...

杨晓凡
2018/01/05
0
0
AI帮清华博士写说唱歌词晋级了,AI相声行不行?

作者 | Just 编辑 | 阿司匹林 出品 | AI科技大本营 人们曾一度认为艺术是免受 AI 侵袭的最后一块净土,却没成想它很快就在这里“撒了个野”。 今年有关《中国好声音》上热搜的话题与对音乐本...

AI科技大本营
2018/08/14
0
0
GANs 造假术领衔,看 2018 最具落地潜力的 9 大 AI 技术趋势

雷锋网(公众号:雷锋网) AI 科技评论按:本文是 Alex Honchar 在 Medium 上发布的三篇系列博客之二。这三篇博客分别从 AI 研究者、产业界的应用开发人员、普通人的角度介绍了作者对于 2018 年...

隔壁王大喵
2018/01/10
0
0
用DensePose,教照片里的人学跳舞,系群体鬼畜 | ECCV 2018

栗子 发自 凹非寺 量子位 出品 | 公众号 QbitAI 怎样让一个面朝镜头、静止不动的妹子,跳起你为她选的舞蹈,把360度身姿全面呈现? Facebook团队,把负责感知的多人姿势识别模型DensePose,与...

量子位
2018/09/10
0
0

没有更多内容

加载失败,请刷新页面

加载更多

Spring Cloud 笔记之Spring cloud config client

观察者模式它的数据的变化是被动的。 观察者模式在java中的实现: package com.hxq.springcloud.springcloudconfigclient;import org.springframework.context.ApplicationListener;i...

xiaoxiao_go
昨天
6
0
CentOS7.6中安装使用fcitx框架

内容目录 一、为什么要使用fcitx?二、安装fcitx框架三、安装搜狗输入法 一、为什么要使用fcitx? Gnome3桌面自带的输入法框架为ibus,而在使用ibus时会时不时出现卡顿无法输入的现象。 搜狗和...

技术训练营
昨天
5
0
《Designing.Data-Intensive.Applications》笔记 四

第九章 一致性与共识 分布式系统最重要的的抽象之一是共识(consensus):让所有的节点对某件事达成一致。 最终一致性(eventual consistency)只提供较弱的保证,需要探索更高的一致性保证(stro...

丰田破产标志
昨天
8
0
docker 使用mysql

1, 进入容器 比如 myslq1 里面进行操作 docker exec -it mysql1 /bin/bash 2. 退出 容器 交互: exit 3. mysql 启动在容器里面,并且 可以本地连接mysql docker run --name mysql1 --env MY...

之渊
昨天
10
0
python数据结构

1、字符串及其方法(案例来自Python-100-Days) def main(): str1 = 'hello, world!' # 通过len函数计算字符串的长度 print(len(str1)) # 13 # 获得字符串首字母大写的...

huijue
昨天
6
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部