本周AI热点回顾:王者荣耀AI绝悟完全体开启,英雄随便选;2张图片就能「算出」一段视频;Nature文章明年起可免费下载

2020/11/30 05:15
阅读数 10

点击左上方蓝字关注我们

01

王者荣耀AI绝悟完全体对战开启:英雄随便选,论文已被NeurIPS收录

人工智能 2 级就来越塔来杀我,这游戏怎么玩?

还记得今年五一假期时,腾讯在王者荣耀游戏中上线的绝悟 AI 挑战吗?大多数玩家只能将将挑战前几个难度,AI 击败你之后还会在聊天里嘲讽。在 AlphaGo 的阴影笼罩围棋之后,人工智能也把触角延伸到了最流行的游戏中。

最近,腾讯 AI Lab 在王者荣耀中的研究也获得了学界的认可,研究人员提交的论文也被全球顶尖人工智能会议 NeurIPS 2020 收录。

而在 11 月中旬,升级版的绝悟 AI 挑战也在王者荣耀中上线,20 个难度关卡的设置为玩家们留下了充足的挑战空间。在游戏中,人工智能由 5 个智能体互相协作,并不拥有全局视野,反应速度也被调整为和人类类似。在高级关卡中,AI 也会和你在开战前进行挑选英雄的 BP 博弈。

在 11 月 28-30 日限时开放的绝悟升级版最终挑战里,玩家和 AI 可以选择目前版本游戏里几乎所有的英雄,也接受 5 人组队挑战。看起来自我博弈的 AI 已经达到了无限接近成熟的水平。

根据已经进行的一些比赛来看,绝悟通过自我博弈学习,早已学会了蹲草丛这样的操作:

如果用公孙离这样能秀的英雄,1v3 也是不难的事:

在挑战开启以后,玩家们发现人机对战通常会变成这个样子:选英雄斗智斗勇,准备用上套路——一进游戏刚拉开架势,就被 AI 拿了一血。

据 AI Lab 的研究人员透露:「有些冷门英雄 AI 玩的非常强势,到时候可能会颠覆一部分大家对于游戏的认知。」

在腾讯 AI Lab 及腾讯天美工作室发表的论文《Towards Playing Full MOBA Games with Deep Reinforcement Learning》中,研究人员们提出了 MOBA AI 学习范式,支持使用深度强化学习来玩完整的 MOBA 游戏。

具体而言,该研究将新的和已有的学习技术结合起来,包括课程自我博弈学习、策略蒸馏(policy distillation), 离策略自适应(off-policy adaption)、多头值估计(multi-head value estimation)、蒙特卡洛树搜索等,在训练和用大量英雄玩游戏,同时巧妙地解决了可扩展性的问题。

多人在线竞技类游戏 MOBA 长久以来一直吸引着众多玩家,其中的王者荣耀、英雄联盟、Dota 2 等最近也常被 AI 研究者当做人工智能的实验场,其中的多智能体、巨大的状态动作空间、复杂的环境等元素向 AI 系统提出了极大的挑战。开发用于 MOBA 游戏的 AI 引起了广泛的关注。

然而,当 OpenAI 的 Dota AI 将游戏限制在只能选择 17 名英雄的情况下,若想扩展英雄库,现有的工作在处理由智能体组合(即阵容)爆炸性增长所导致的游戏复杂性方面的问题存在难度。因此,现有的 AI 系统并不能掌握完全没有限制的 MOBA 游戏。

在日均活跃玩家数量超 1 亿的国民手游王者荣耀上进行测试,展示了人类可以打造出能够击败顶级电子竞技玩家的超级 AI 智能体。通过文献中首次对 MOBA AI 智能体进行大规模性能测试,证明了该 AI 的优越性。

论文地址:

https://arxiv.org/abs/2011.12692

信息来源:机器之心

02

2张图片就能「算出」一段视频,Reddit网友都惊呆了

只给AI两张图片,就能得到高帧率动态视频?输入的两张图像,重叠后是这样的:

而算出来的视频,是酱婶的:

不错,这又是视频插帧算法的功劳。‍‍‍‍‍‍‍‍‍‍‍‍极限操作玩得6,让老电影变丝滑的常规手法,这个名叫RIFE的AI算法同样信手拈来。右边这支经典探戈,看上去是不是比左边丝滑多了?

不仅是老电影,飞行表演的精彩瞬间,也能一口气从每秒24帧提升到每秒96帧。

动图效果有所损失,不妨再来看一眼原视频。

这项新研究,来自旷视和北大。不仅能让老影像资料追上人民群众对高帧率的需求,支持2X/4X/8X高质量插值,它还有一个最大的特点:快。

看过了RIFE的表现,网友们不由惊叹,这是要超越那只经常在各种修复视频里出现的插帧AI DAIN,引领一波新潮流的节奏啊?一时之间,RIFE在Reddit上的热度飙升到了2.8k。那么,这样的效果究竟是怎么实现的呢?


从双向估计,到一步预测中间帧。视频插帧,通常是用光流预测算法来预测中间帧,并插入两帧之间。光流,就像光的流动一样,是一种通过颜色来表示图像中目标移动方向的方式。

传统光流预测算法,通常根据前后两帧视频来预测中间的某一帧长啥样。将预测完成的图像插进去后,视频看起来就会变得更丝滑。以DAIN的算法为例,如果要预测t时刻的帧,就需要t时刻的前后两帧视频,通过光流预测算法来实现。

但是这一类的算法会产生一个缺点:在预测过程中,如果用前后两帧图像产生双向光流,用线性组合来估计中间流,预测出来的结果,在运动边界区域就会出现伪影。

这样的伪影,使得重建中间帧图像的效果不尽人意。那么,如果换一种思路,直接先预测中间流呢?

相比于利用前一帧和后一帧进行两次估计,这里的IFNET (a Specialized and Efficient Intermediate Flow Network)算法,将直接采用线性运动假设,对中间帧进行一次估计。

效果也显而易见,相比于利用前后两帧的双向估计所产生的光流,利用IFNET估计出的光流效果非常清晰,而且几乎没有伪影。

利用这种方式重建图像,不仅光流边缘看得清楚,而且速度也更快。论文提到,RIFE是首个基于光流的实时视频插帧方案。由于中间帧预测,直接假设了前后两帧的变换是线性的,相当于每帧预测中直接少了一次估计。

信息来源:量子位

03

飞桨深度学习开源框架2.0抢先看:成熟完备的动态图开发模式

 

深度学习框架在编程界面上,一般有两种编程模式:命令式编程和声明式编程,即动态图和静态图。动态图模式下程序可即时执行并输出结果,编程体验和调试便捷性更佳;静态图模式下需完成整体网络结构的定义再执行,编程调试便捷性不够,但能够对全局编译优化,更有利于性能的提升,并天然利于模型保存和部署。

飞桨同时支持这两种编程模式,经过长期的深入技术探索和创新,已经实现同时兼顾两种方式的优势,达成了更有利于开发者的“动静统一的理想国”:

  • 模型开发时,采用动态图模式,编程效率高调试方便;

  • 模型训练部署时,支持动态图一键式自动转静态图,实现高性能训练,并无缝衔接模型存储和部署。

图1.飞桨动静统一开发模式

飞桨开源框架最新版本上,该模式已经达到很高的成熟完备度。开发者既可体验到动态图开发模式带来的极大的便利性,用动态图实现深度学习领域最前沿的模型算法;又可享受到经过极致优化的运行效率,并且可以很容易的将动态图转换为静态图来进行推理和部署。

成熟的动态图模式,可以为开发者带来极致体验,更优雅地编程。总结一下,便利性主要体现在以下三方面:

  • 调试程序的便利性。在动态图开发模式下,用户运行飞桨提供的API后,可即时返回运行结果,不需要先创建计算图再运行,这样便于用户更加方便地组织代码,交互式地调试程序。

  • 组建网络的高效性。在动态图开发模式下,用户可以使用Python的条件判断、循环等控制语句来执行模型算法的运算,不再需要使用静态图中的控制操作来执行运算,这样便于用户更加高效地组建网络。

  • 构建模型的灵活性。在动态图开发模式下,用户可以根据控制流选择不同的分支网络,也可以更自然地构建权重共享的网络,更自然地实现自定义损失函数和循环网络、以及其他新颖的网络结构,从而灵活地进行深度学习模型的创新。

同时,在最新版本上,飞桨动态图提供了对计算机视觉、自然语言处理、推荐系统、语音识别等领域主流算法模型的全面支持,同时也对前沿的学术研究提供了非常好的支持。已开放的动态图模型数量达到了100+。这些模型都已开源在GitHub上,开发者可基于动态图模型进行AI应用开发和前沿学术研究:    

https://github.com/PaddlePaddle/models/tree/develop/dygraph

一行代码实现动转静。

动静转换的操作非常简单,仅需添加一个装饰器( @to_static ),框架就会自动将动态图的程序,转换为静态图的program,并使用该program训练、保存为静态图模型以实现推理部署。

import paddle
from paddle.static import InputSpec
from paddle.fluid.dygraph import Layer
from paddle.jit import to_static


class SimpleNet(Layer):
    def __init__(self):
        super(SimpleNet, self).__init__()
        self.linear = paddle.nn.Linear(10, 3)

    @to_static(input_spec=[InputSpec(shape=[None, 10], name='x'), InputSpec(shape=[3], name='y')])
    def forward(self, x, y):
        out = self.linear(x)
        out = out + y
        return out


net = SimpleNet()
paddle.jit.save(net, './simple_net')

飞桨动转静功能除了简单的一键式操作,还在进一步降低转换出错概率、提供便捷的转换诊断工具方面做了大量工作,为用户提供便捷的体验。

信息来源:飞桨PaddlePaddle

04

Nature文章明年起可免费下载,不过前提是作者得交7.4万元

好消息!从明年开始在Nature上发表的论文,有些不用付费就可以下载了。

出版商Springer Nature宣布,自2021年起,论文作者在向Nature及其32种旗下期刊投稿时,可以选择以OA (开放获取)形式发表。通过这种形式发表的论文向全社会开放,无论用户所在机构是否支付了订阅费,一律可以免费下载。

不过,前提是论文作者需支付9500欧元(约合人民币7.4万元)的文章处理费。(该费用仅向发表论文收取。)当然,论文作者如果不接受,也可以选择传统方式发表论文,即不支付文章处理费,而让订阅机构或个人付费下载。

对于论文作者来说,开放获取虽然费用更高,但是可以增加文章的阅读量和引用量,有利于扩大自己论文的影响力。据Springer Nature的数据统计,相对于非OA论文,OA论文下载量是其4倍,引用率是其1.6倍,社交媒体引评量是其2.4倍。

目前,Nature及其子刊大部分文章,都需要支付订阅费用才能阅读和下载,并通过订阅方式获取利润,现在等于将部分费用转嫁到作者身上。

此次Natue对每篇OA论文收费9500欧元,遭到了不少科研人员的质疑,因为其他OA期刊的文章处理费最高也就5000美元,Nature的费用比他们高出将近一倍。

一些OA倡导者批评Springer Nature的费用太高。哈佛学术交流办公室主任Peter Suber认为,这是一笔“声誉税”,因为这是期刊高拒绝率付出的代价,但他认为这并不能保证期刊更高的质量。

‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

他说:“任何赞助方、大学和作者支付这笔费用都是荒谬的。”加拿大西蒙·弗雷泽大学的传播学者Alperin说,尽管这一声明表明普遍开放获取是不可避免的信号,但对于贫穷国家的研究人员而言,这笔费用实在难以承受。

而伊利诺伊大学香槟分校的图书馆员Lisa Hinchliffe表示,对于作者来说,这笔收费不一定算太高。她认为许多作者会认为这是一个可以接受的价格。Springer Nature发言人回应称,收费比其他出版物都要高,因为Nature品牌的期刊审阅的论文比发表的论文多,并且聘用内部编辑和出版人员,其工作对研究人员具有“巨大价值”。Nature等期刊生产成本中有很大一部分来自评审后被拒绝的论文,如果只能从发表的几篇文章中收取收入,那么每篇文章的费用就会很高。

Springer Nature还引入了一个“指导性OA”(Guided OA)计划,正在《自然·物理学》、《自然-遗传学》和《自然·方法》等6个子刊上进行试验。

信息来源:量子位

05

用算法改造过的植物肉,有兴趣试试么?

本月初,麦当劳宣布,将于 2021 年推出植物肉全新产品线 McPlant,新品品类将包括汉堡、鸡肉替代品以及早餐三明治。事实上,麦当劳并不是尝试植物基产品的首家快餐店,McPlant 也并非麦当劳在植物肉汉堡上的首次试水。

去年 9 月-2020 年初,麦当劳就曾与美国植物肉生产商 Beyond Meat 合作,在加拿大安大略省部分门店低调发售植物肉汉堡 P.L.T.,测试消费者对人造肉汉堡的接受程度。今年 10 月 12 日,肯德基在国内北上广深杭武汉等 6 个城市的 210 家门店,限时限量试售植物基新品——植物肉汉堡和植物肉鸡块。

植物肉食品顾名思义,是指用植物蛋白替代动物蛋白而制作的食品。相较于肉、蛋、奶等富含动物蛋白的食物,植物肉食品的售价更高。造成这种现象的原因主要有两个:首先是由于植物基食品的开发尚处于早期,成本高,规模效应不明显;其次植物基食品代表了一种更环保、更健康的生活理念,商家希望通过提高售价吸引中高消费人群。

以「人造肉第一股」Beyongd Meat 为例,其研究方法主要是从植物(大豆蛋白、豌豆蛋白)中选择蛋白质和营养元素,然后加入诸如大豆血红蛋白等从植物中提取的着色剂和调味剂,模拟真肉的口感、外观和营养。

据联合国粮食及农业组织公布,可供人类食用的植物种类多达 25 万种,而动植物之间在某些化学构成方面,具有一定的相似度,因此拆解动物蛋白食品,用源自植物的营养元素替代,就成为了可能。

然而动物蛋白食品成分复杂,人类每次只能识别出其中的 2-3 种成分,要想仅依靠人类分解,无疑效率低、效果差。

借助人工智能,可以很好地简化这个问题。成立于 2015 年的智利食品科技公司 NotCo,开发了一种机器学习算法,叫做 Giuseppe。

利用这个算法,可以从一个包含 7000 种植物氨基酸结构的 7 个数据集中,为动物蛋白匹配理想的替代品。

这些分子数据包括食材色泽,以及口感、触感、酸度、浓郁度等科研参数,为植物基食品研发提供了不同维度的参考标准。

根据科研人员输入的食品名称,Giuseppe 会输出 50-60 个配方。研发团队测试所有配方版本后,依据味道、质地、颜色等属性的数值给配方排序,将其交由 Giuseppe 进行迭代,最终找到在口感、外观、营养元素等方面,更接近动物性食物的配方。

点击观看 NotCo 的产品研发故事

截止目前 NotCo 已经成功推出了「以假乱真」的 Not 系列食品,包括牛奶、蛋黄酱、冰激凌、肉饼等,现在他们还在着力开发金枪鱼替代品。

除了工业界,学界也对此表现出了极大的兴趣。2019 年美国圣母大学科研人员发表论文「Amino acids distribution in economical important plants: a review」,探讨了重要经济作物的氨基酸分布情况。

科研人员通过 Google Scholar、 Scopus 和 Google 等渠道,收集了 142 种重要经济作物的氨基酸分布情况,大到国家地域,小到植物部位,分门别类汇总了植物所含有的必需氨基酸、非必须氨基酸、氨基酸种类等详情,对研究动物蛋白的植物替代品具有重要意义。

论文地址:

https://www.sciencedirect.com/science/article/pii/S2452072119300449

信息来源:HyperAI超神经

飞桨(PaddlePaddle)以百度多年的深度学习技术研究和业务应用为基础,是中国首个开源开放、技术领先、功能完备的产业级深度学习平台,包括飞桨开源平台和飞桨企业版。飞桨开源平台包含核心框架、基础模型库、端到端开发套件与工具组件,持续开源核心能力,为产业、学术、科研创新提供基础底座。飞桨企业版基于飞桨开源平台,针对企业级需求增强了相应特性,包含零门槛AI开发平台EasyDL和全功能AI开发平台BML。EasyDL主要面向中小企业,提供零门槛、预置丰富网络和模型、便捷高效的开发平台;BML是为大型企业提供的功能全面、可灵活定制和被深度集成的开发平台。

END

本文同步分享在 博客“飞桨PaddlePaddle”(CSDN)。
如有侵权,请联系 support@oschina.cn 删除。
本文参与“OSC源创计划”,欢迎正在阅读的你也加入,一起分享。

展开阅读全文
加载中

作者的其它热门文章

打赏
0
0 收藏
分享
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部