文档章节

专访阿里研究员袁全:从 AI 玩《星际争霸》谈认知智能的现状与趋势

暖夏未眠丶
 暖夏未眠丶
发布于 2017/06/14 15:15
字数 2020
阅读 5
收藏 0

摘要: 推荐是经典的机器学习&大数据任务,依赖于每天产生的上亿用户数据,而认知计算最核心的能力是实现算法的智能化,提升智能体的自主学习能力,对大数据依赖性会变弱。

不同于以提升点击率和转化率等优化指标为主的机器学习模型,认知计算以实现算法和智能化为核心,训练智能体的自主学习能力,以及多个智能体之间的协作和配合能力,和原来优化大数据和算法具有很大的区别。近日,笔者就认知计算、应用场景、算法优化、深度学习以及云计算&大数据技术的关系等问题与阿里认知计算实验室研究员、资深总监袁全进行了深入探讨。

图片描述

阿里认知计算实验室研究员、资深总监袁全(左一)

深耕细作,瞭望人工智能新征程

“人工智能时代,我们专注认知计算研究,以积累核心算法系统为首要目标”——袁全。

袁全的研究始于06年开始的个性化推荐,彼时他在IBM研究院率先研发这一新技术。在12年加入阿里后,他主要负责手机淘宝、天猫的个性化推荐技术,包括算法、平台和产品的协同。袁全和他的团队致力于个性化推荐算法,典型产品有“有好货”、“猜你喜欢”等。15-16年团队主要研究淘宝首页的全面个性化,在去年年中的时候,以AlphaGo为代表的人工智能、认知决策技术的升级带来了非常多的新理念和新技术,袁全所带领的新团队也转战认知计算这一领域,目标是在人工智能时代,积累核心算法系统和能力。

挑战与机遇并存,认知学习深入解读

“最大的挑战在于它是一个非常新的多种类交叉学科,涉及内脑科学、认知心理学、机器学习甚至是博弈论,是一个全新的开始”——袁全。

推荐是经典的机器学习&大数据任务,依赖于每天产生的上亿用户数据,而认知计算最核心的能力是实现算法的智能化,提升智能体的自主学习能力,对大数据依赖性会变弱。从商品推荐到认知计算这一转变过程中,最重要的是要依靠认知科学来启发算法的认知设计,袁全表示,因为人脑是我们唯一所知的具有举一反三学习能力的物体,所以其中最大的挑战就在于它是一个非常新的多种类的交叉学科,涉及脑科学、认知心理学、机器学习甚至是博弈论,是一个全新的开始。

最近袁全带领团队在星际争霸游戏中对智能体的研究,则恰好验证了这一点。他们与伦敦大学学院计算机系汪军教授紧密配合,发布并开源了Gym StarCraft框架,探索新的训练智能体的方式,而不再像以前那样仅以提升学习指标为目标,而是致力于在一个干净的的环境中,训练智能体的自主学习能力,以及多个智能体之间的沟通与协作。事实上,《星际争霸》有其自身的特点,它的搜索空间比围棋更大,围棋是10的100次方数量级,而完整的星际游戏却是10的1000次方,整整大了10个数量级。而且不同于围棋双方博弈的透明性,《星际争霸》的决策是不确定性博弈,需要平衡短中长期的收益,与电商中的若干主要问题联系也很密切。(** 论文下载:**Multiagent Bidirectionally-Coordinated Nets for Learning to Play StarCraft Combat Games

图片描述

应用于《星际争霸》游戏中的双向协调网络(BiCNet)

深度学习作为认知学习中重要推动力和实验工具,也已演化成研究智能的一个非常重要的平台,包括越来越多的国内外高校都在用深度学习去模拟人脑结构,尤其是深度神经网络对人脑的罗列和实现能力。当然后续也会结合其他流派的一些算法,例如结合符号主义、概率推理等,从而实现更好的学习能力。

机遇与挑战并存,更好的学习能力往往意味着更艰难的当下。袁全表示,在应用过程中,团队不断改进算法等技术,以期实现更佳的效果和用户体验。细化到算法调优上,不仅从agent通信机制间提高通信效率,还兼顾agent个体和全体收益,智能体的反馈激励机制优化、全局和动态信息的组合运用等,使得模型的通用性和扩展能力大大增强。

不过随着智能发展的火爆,各种AI威胁论也随之发酵。从团队的整个学习过程,以及AlphaGo等例子来看,智能的学习能力确实很有可能超越人类,机器协同效率远高于人的协同效率,很可能是一个催化要素,加之硬件和算法不断进步,智能对人类的威胁的确可能存在。现在看来最好的方式,是开放研究、共享新技术,多方共同逼近和实现目标;同时在AI的机制设定上,多引导其往人类不擅长、解决不了的问题上进行,与人类形成良性协作,相互增强。

另外,袁全还谈到了云计算、大数据与认知学习的微妙关系。诚然,智能体的训练对海量数据的处理能力提出了更高的要求,三者相辅相成,但是目前从很多的进展来看,小样本学习的技术也在不断提升,所以数据量级并非越大越好,学习能力越强的智能体对数据的依赖程度越低,这也是一个新的认知。

立足当下,美好蓝图亟待描绘

“引进智能化,理想情况就是说,每个用户背后都会有个智能体在专注地为他服务”——袁全。

在研究认知计算的过程中,袁全的团队由浅入深,不断补缀;结合AI在推荐等领域的应用,袁全认为利用AI去解决推荐的惊喜性问题,是一个技术和商业的很好结合。基于AI提供用户需要但自身并未意识到的商品和信息服务,逐步引进智能化,理想情况就是说,每个用户背后都会有个智能体在专注地为他服务。

给初学者的建议

对于想要从事个性化推荐、认知计算、通用智能的同学,袁全表示,扎实的功底必不可少,包括基础的编程能力和数学能力。在此之上,再根据个人的特点选择分支:甚至是一些偏深入研究的方向,例如,受脑神经科学启发的认知学习机制;或者选择通用智能领域,很多做通用智能的人都具有扎实的机器学习、强化学习背景;最后是非常重要的工程和系统架构能力,这是实现智能必不可少的一点。

本文为云栖社区原创内容,未经允许不得转载,如需转载请发送邮件至yqeditor@list.alibaba-inc.com

用云栖社区APP,舒服~

原文链接

本文转载自:

暖夏未眠丶
粉丝 0
博文 250
码字总数 427
作品 0
太原
私信 提问
深度强化学习+启发人类的决策智能,专访一家有愿景的中国企业「启元世界」

雷锋网 AI 科技评论按:上次我们报道了来自中国的决策智能企业「启元世界」,他们凭借自己的核心技术深度强化学习和决策智能平台,在 NeurIPS 2018 多智能体竞赛「炸弹人团队赛」中获得了 Le...

杨晓凡
01/11
0
0
机器人陪你打《星际争霸》,背后是一场AI的猜心游戏

  不久前,在北大承办ACM-ICPC(国际大学生程序设计竞赛)全球总决赛期间,上演了一场人机协作及人机对抗的《星际争霸》赛。   这是来自智能决策公司启元世界的一款基于《星际争霸Ⅱ》的...

中国机器人
2018/04/26
0
0
1月11日云栖精选夜读:阿里安全资深专家杭特谈安全圈之“怪现状”

使“数据”自身变得“攻不可破,盗不可用”,才是安全的最终目的。 热点热议 阿里安全资深专家杭特谈安全圈之“怪现状” 作者:华蒙 发表在: 阿里安全 还有这种操作?既是黑客又是居家男的阿...

yq传送门
2018/01/11
0
0
中国人工智能大会CCAI 2016圆满落幕

8月26日至27日,在中国科学技术协会、中国科学院的指导下,由中国人工智能学会发起主办、中科院自动化研究所与CSDN共同承办的2016中国人工智能大会(CCAI 2016)在北京辽宁大厦盛大召开,这也...

玄学酱
2018/05/17
0
0
人工智能组团战胜人类玩家 别紧张,这只是算力上的胜利

近日,硅谷“钢铁侠”马斯克创立的人工智能非营利组织OpenAI 宣布,由5个神经网络组成的OpenAI Five,已经能够组成5v5团队在经典战斗竞技类游戏《刀塔2》(Dota2)中击败人类业余玩家队伍。7...

稿源:科技日报
2018/07/16
0
0

没有更多内容

加载失败,请刷新页面

加载更多

关于java中变量的重名问题

在java语言中,变量的命名有很多规则和规范,但是有的地方可以使用相同的变量名,有的地方却不能使用,这是为什么呢? 下面是个人的一点见解,是从作用域和内存来分析的,目的是为了方便理解...

INEVITABLE
21分钟前
4
0
MySQL的COUNT语句,竟然都能被面试官虐的这么惨?

数据库查询相信很多人都不陌生,所有经常有人调侃程序员就是CRUD专员,这所谓的CRUD指的就是数据库的增删改查。 在数据库的增删改查操作中,使用最频繁的就是查询操作。而在所有查询操作中,...

程序员修BUG
24分钟前
4
0
PHP+Mysql统计文件下载次数实例

PHP+Mysql统计文件下载次数实例,实现的原理也很简单,是通过前台点击链接download.php传参id,来更新点击次数。 获取文件列表: <?php require 'conn.php'; $query = mysql_query("S...

ymkjs1990
25分钟前
3
0
一、环境变量及Jshell

一、环境变量: 作用: 可执行文件所在位置的链接。CLI输入命令时,通过环境变量指引找到命令所在位置 windows的环境变量名不区分大小写,Linux区分 Windows下的用户变量即只有当前用户生效 ...

清自以敬
26分钟前
4
0
微软改名部又出手:Office 365正在悄悄更名为Microsoft 365

然而让人疑惑的是Microsoft 365 是微软面向企业提供的服务,这项服务附带操作系统以及办公软件的订阅授权。 现在把面向家庭消费者的办公软件也换成Microsoft 365 是什么操作?没人知道因为微...

linuxCool
26分钟前
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部