文档章节

未来已来!阿里小蜜AI技术揭秘

_夜枫
 _夜枫
发布于 2017/06/23 11:06
字数 3770
阅读 5
收藏 0
点赞 0
评论 0

原文链接

 

1.双11的挑战与服务模式的转型



在全球人工智能领域不断发展的今天,包括Google、Facebook、Microsoft、Amazon、Apple等互联公司相继推出了自己的智能私人助理和机器人平台,智能人机交互成为各大公司在人工智能战场上激烈竞争的入口级领域。 智能人机交互通过拟人化的交互体验逐步在智能客服、任务助理、智能家居、智能硬件、互动聊天等领域发挥巨大的作用和价值。

在2015年7月,我们阿里也推出了自己的智能私人助理-阿里小蜜,一个围绕着电子商务领域中的服务、导购以及任务助理为核心的智能人机交互产品。通过电子商务领域与智能人机交互领域的结合,提升传统电商领域的能效,带来传统服务行业模式的变化与体验的提升。

1.1智能人机交互带来服务行业模式的变化

传统的服务行业是一个人力密集型的行业,就拿我们阿里巴巴双11狂欢节来说,无论是对于阿里直接对外的服务(消费者服务和商家服务)还是淘宝商家的服务都面临着当天服务量的巨大井喷,人力扩容成为每年阿里以及商家巨大的挑战。传统人力密集型服务模式(以自营客服、外包客服和云客服为主的服务模式)亟待被颠覆和改变,围绕着以阿里小蜜产品为核心,通过智能人机交互与人工服务相结合的模式才是未来真正的服务模式。机器通过智能化技术处理掉绝大部分的简单、重复等可识别处理的问题,对于解决不了的问题流向人工,让人提供更有温度也更加专业的服务。通过智能+人工相结合的模式探索,在今年的双11期间,阿里小蜜整体智能服务量达到643万,其中智能解决率达到95%,智能服务在整个服务量(总服务量=智能服务量+在线人工服务量+电话服务量)占比也达到95%,成为了双11期间服务的绝对主力。
 



1.2 智能人机交互带来服务体验的提升

在体验维度,由于机器的运算速度远超于人,因此智能人机交互可以带来提升:智能交互相比人工可以达到急速的秒级体验,而人的服务通常需要一定时间的回复等待。并且在互动领域,智能人机交互也带来了一种新的模式和新的玩法,带来更多价值。
 

2. 阿里小蜜及阿里小蜜平台介绍



阿里小蜜是电子商务领域的智能私人助理,基于阿里海量消费和商家数据,结合线上、线下的生活场景需求,以智能+人工的模式提供智能导购、服务、助理的拟人交互业务体验。

1.在跨终端、多场景领域支持多轮交互、多模交互(文本、语音和图像)和问题推荐预测;

2.支持多模型(文本模型、客户模型、语音识别和图像识别)识别客户意图;

3.支持多领域识别和路由分流;

阿里小蜜整体体系图如下:
 



通过1年多阿里小蜜在阿里业务体系内的不断尝试和摸索,今年在电子商务生态圈范围内,在基于千牛的买卖家生态圈、基于钉钉的企业生态圈上,我们将阿里小蜜进行平台化开放,同时赋能给我们商家和企业用户。未来我们期望通过不断的领域数据和技术模型的积累,能够在阿里其他生态圈(例如:阿里云)逐步进行开放,赋能更多电子商务生态圈领域。

阿里小蜜平台结构图如下:
 



阿里小蜜在各个领域系统示例截图:
 


 

3. 阿里小蜜技术实践



3.1 智能人机交互系统

智能人机交互系统,俗称:chatbot系统或者bot系统,我们核心需要做的事情是理解人类的语言意思,进而给予合理的答案或者Action。

人机交互基本流程如下:
 



其核心部分就是NLU(自然语言理解),通过对话系统处理后最后通过自然语言生成的方式给出答案。一段语言如何理解对于计算机来说是非常有难度的,例如:“苹果”这个词就具备至少两个含义,一个是水果属性的“苹果”,还有一个是知名互联网公司属性的“苹果”。因此在阿里小蜜这样在电子商务领域的场景中,我们先采用分领域分层分场景的方式进行架构抽象,然后再根据不同的分层和分场景采用不同的机器学习方法进行技术设计。首先我们将对话系统从分成两层:

1.意图识别层:识别语言的真实意图,将意图进行分类并进行意图属性抽取。意图决定了后续的领域识别流程,因此意图层是一个结合上下文数据模型与领域数据模型不断对意图进行明确和推理的过程;

2.问答匹配层:对问题进行匹配识别及生成答案的过程。在阿里小蜜的对话体系中我们按照业务场景进行了3种典型问题类型的划分,并且依据3种类型会采用不同的匹配流程和方法:

1.问答型:例如“密码忘记怎么办?”→ 采用基于知识图谱构建+检索模型匹配方式

2.任务型:例如“我想订一张明天从杭州到北京的机票”→ 意图决策+slots filling的匹配方式

3.语聊型:例如“我心情不好”→ 检索模型与Deep Learning相结合的方式

3.2 阿里小蜜意图识别的技术方案

通常在意图识别领域我们将其抽象成为机器学习中的分类问题来解决,在阿里小蜜的技术方案中除了传统的文本特征之外,考虑到本身在对话领域中存在语义意图不完整的情况,我们也加入了用实时、离线用户本身的行为及用户本身相关的特征,通过深度学习方案构建模型,对用户意图进行预测。如下图:
 



在基于深度学习的分类预测模型上,我们有两种具体的选型方案:一种是多分类模型,一种是二分类模型。多分类模型的优点是性能快,但是对于需要扩展分类领域是整个模型需要重新训练;而二分类模型的优点就是扩展领域场景时原来的模型都可以复用,可以平台进行扩展,缺点也很明显需要不断的进行二分,整体的性能上不如多分类好,因此在具体的场景和数据量上可以做不同的选型。整体的基本技术思路就是将行为因子与文本特征分别进行Embedding处理,通过向量叠加之后再进行多分类或者二分类处理。这里的文本特征维度可以选择通过传统的bag of words的方法,也可使用Deep Learning的方法进行向量化。具体如下图:
 



目前主流的智能匹配技术分为如下4种方法:

1 基于模板匹配(Rule-Based)

2.基于检索模型(Retrieval Model)

3.基于统计机器翻译模型(SMT)

4.基于深度学习模型(Deep Learning)

在阿里小蜜的技术场景下,我们采用了基于模板匹配,检索模型以及深度学习模型为基础的方法原型来进行分场景(问答型、任务型、语聊型)的会话系统构建。

问答型:基于知识图谱构建+检索模型匹配方式特点:有领域知识的概念,且知识之间的关联性高,并且对精准度要求比较高基于问答型场景的特点,我们在技术选型上采用了知识图谱构建+检索模型相结合的方式来进行核心匹配模型的设计。

知识图谱的构建我们会从两个角度来进行抽象,一个是实体维度的挖掘,一个是短句维度进行挖掘,通过在淘宝平台上积累的大量属于以及互联网数据,通过主题模型的方式进行挖掘、标注与清洗,再通过预设定好的关系进行实体之间关系的定义最终形成知识图谱。基本的挖掘框架流程如下:
 



挖掘构建的知识图谱示例如下:
 



基于知识图谱的匹配模式具备以下几个优点:

1 在对话结构和流程的设计中支持实体间的上下文会话识别与推理

2.通常在一般型问答的准确率相对比较高(当然具备推理型场景的需要特殊的设计,会有些复杂)

同样也有明显的缺点:

1.模型构建初期可能会存在数据的松散和覆盖率问题,导致匹配的覆盖率缺失;

2.对于知识图谱增量维护相比传统的QA Pair对知识的维护上的成本会更大一些;

因此我们在阿里小蜜的问答型设计中,还是融入了传统的基于检索模型的对话匹配。

其在线基本流程分为:

1.提问预处理:分词、指代消解、纠错等基本文本处理流程;

2.检索召回:通过检索的方式在候选数据中召回可能的匹配候选数据;

3.计算:通过Query结合上下文模型与候选数据进行计算,通过我们采用文本之间的距离计算方式(余弦相似度、编辑距离)以及分类模型相结合的方式进行计算;

4.最终根据返回的候选集打分阈值进行最终的产品流程设计。

离线流程分为:

1.知识数据的索引化;

2.离线文本模型的构建:例如Term-Weight计算等。

检索模型整体流程如下图:
 



任务型:意图决策+slots filling的匹配方式

特点:有领域知识的概念,每个任务负责独立的业务流程,任务之间相对互斥性强,精准度要求高。基于任务型的特点,在技术选型上,我们采用了意图决策+slot filling的方式进行会话匹配设计。首先按照任务领域进行本体知识的构建,例如机票的领域本体知识场景如下:
 



在问答匹配过程中结合上下文模型和领域数据模型不断在Query中进行slot属性的提取,并循环进行本体意图树的不断填充和修改,直到必选意图树填充完整后进行输出。如下图:
 



语聊型:检索模型与Deep Learning相结合的方式

特点:非面向目标,语义意图不明确,通常期待的是语义相关性和渐进性,对准确率要求相对较低。

面向open domain的聊天机器人目前无论在学术界还是在工业界都是一大难题,通常在目前这个阶段我们有两种方式来做对话设计:一种是学术界非常火爆的Deep Learning生成模型方式,通过Encoder-Decoder模型通过LSTM的方式进行Sequence to Sequence生成,如下图:
 



一种是Generation Model(生成模型):

1.优点:通过深层语义方式进行答案生成,答案不受语料库规模限制;

2.缺点:模型的可解释性不强,且难以保证一致性和合理性回答。

另外一种方式就是通过传统的检索模型的方式来构建语聊的问答匹配。

Retrieval Model(检索模型):

1.优点:答案在预设的语料库中,可控,匹配模型相对简单,可解释性强;

2.缺点:在一定程度上缺乏一些语义性,且有固定语料库的局限性。

因此在阿里小蜜的聊天引擎中,我们结合了两者各自的优势,将两个模型进行了融合形成了阿里小蜜聊天引擎的核心。先通过传统的检索模型检索出候选集数据,然后通过Seq2Seq Model对候选集进行Rerank,重排序后超过制定的阈值就进行输出,不到阈值就通过Seq2Seq Model进行答案生成,整体流程如下图:
 


 

4 智能交互未来的展望



目前的人工智能领域任然处在弱人工智能阶段,特别是从感知到认知领域需要提升的空间还非常大。智能人机交互在面向目标的领域已经可以与实际工业场景紧密结合并产生巨大价值,随着人工智能技术的不断发展,未来智能人机交互领域的发展还将会有不断的提升,对于未来技术的发展我们值得期待和展望:

1.数据的不断积累,以及领域知识图谱的不断完善与构建将不断助推智能人机交互的不断提升;

2.面向任务的垂直细分领域机器人的构建将是之后机器人不断爆发的增长点,open domain的互动机器人在未来一段时间还需要不断提升与摸索;

3.随着分布式计算能力的不断提升,深度学习在席卷了图像、语音等领域后,在NLP(自然语言处理)领域将会继续发展,在对话、QA领域的学术研究将会持续活跃;

在未来随着学术界和工业界的不断结合与积累,期待人工智能电影中的场景早日实现,人人都能拥有自己的智能“小蜜”。

[ 此帖被琴瑟琵琶在2017-06-22 13:47重新编辑 ]

 

 

原文链接

 

本文转载自:http://click.aliyun.com/m/23947/

共有 人打赏支持
_夜枫
粉丝 10
博文 506
码字总数 0
作品 0
朝阳
后端工程师
全球最强大脑在哪里?阿里小蜜算法团队在寻找

阿里小蜜是什么? 阿里小蜜是阿里巴巴集团智能服务事业部旗下的面向电商领域的服务机器人。阿里小蜜所在的智能服务事业部,致力于以体验为核心,通过人工智能算法,以数据和技术为驱动,提升...

技术小能手
06/12
0
0
2017天猫双11,1682亿背后的阿里绝密50+技术

摘要:2017天猫双11, 交易峰值32.5万/秒,支付峰值25.6万/秒,数据库处理峰值,4200万次/秒。1682亿数字的背后是50+神秘技术,让我们在阿里云上与所有新技术相遇! 2017天猫双11的交易额定...

云栖社区
2017/11/13
0
0
【资料合集】2017云栖大会·北京峰会回顾合集:PDF下载

2017云栖大会·北京峰会于12月19-20日在北京国家会议中心召开,阿里云年度重磅发布集中登场,30多场主题论坛,百位技术专家深度解读大数据、人工智能、企业级互联网架构等行业前沿技术,并进...

yunqi_share
2017/12/27
0
0
剧透 | 未来人机交互方式原来是这样的...

随着语音交互、自然语言处理、多模态等技术的发展,人机交互方式已经变得越来越简单,目前人机交互也已经成为当下最热的研究方向之一。但是平心而论,作为人工智能领域的核心技术,现有的交互...

仁太
03/06
0
0
直播 | 2017阿里双11在线技术峰会

技术成就辉煌,今年的双11毫无悬念地再次刷新了全球记录——11秒交易额破亿,28秒破10亿,3分01秒破百亿,40分12秒破500亿,9小时破1000亿……最终的交易额稳稳定格在了1682亿,不仅创造了极...

enohtzvqijxo00atz3y8
2017/11/29
0
0
双11享Go了吗?2017阿里双11在线峰会续写科技盛宴!

技术成就辉煌,今年的双11毫无悬念地再次刷新了全球记录——11秒交易额破亿,28秒破10亿,3分01秒破百亿,40分12秒破500亿,9小时破1000亿……最终的交易额稳稳定格在了1682亿,不仅创造了极...

云栖社区
2017/11/28
0
0
12月12日-13日,12位阿里大咖解密2017阿里双11技术支撑

技术成就辉煌,今年的双11毫无悬念地再次刷新了全球记录——11秒交易额破亿,28秒破10亿,3分01秒破百亿,40分12秒破500亿,9小时破1000亿……最终的交易额稳稳定格在了1682亿,不仅创造了极...

k6t9q8xks6iikzppifq
2017/11/29
0
0
阿里巴巴孙健:关于人机对话交互的思考、实践和未来展望

摘要:人工智能的出现使得传统交互的本质发生改变,从原来非常确定性的行为变成了非常开放的行为。阿里巴巴智能服务事业部资深算法专家、阿里巴巴智能服务事业部北京团队负责人孙健在《云栖大...

萌萌怪兽
04/17
0
0
他如何从普通实习生,成长为阿里 AI 领域最年轻的 P9 之一?

作者:100offer 公众号ID:Im100offer 人物简介:海青,阿里巴巴集团 P9 级员工,人工智能领域高级专家,8 年工作经验,曾参与支付宝业务的建立过程,并带领团队为其设计智能客服平台,目前负...

100offer
2017/10/12
0
0
马云的机器智能,背后是阿里的大规模人机社会化协作

2017年7月国务院发布的《新一代人工智能发展规划》指出,我国发展人工智能的重要任务之一是培育高端高效的智能经济,要促进人工智能与各产业领域深度融合,形成数据驱动、人机协同、跨界融合...

云科技时代
2017/11/13
0
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

shell中的函数、shell中的数组、告警系统需求分析

shell中的函数 格式: 格式: function f_name() { command } 函数必须要放在最前面 示例1(用来打印参数) 示例2(用于定义加法) 示例3(用于显示IP) shell中的数组 shell中的数组1 定义数...

Zhouliang6
今天
2
0
用 Scikit-Learn 和 Pandas 学习线性回归

      对于想深入了解线性回归的童鞋,这里给出一个完整的例子,详细学完这个例子,对用scikit-learn来运行线性回归,评估模型不会有什么问题了。 1. 获取数据,定义问题     没有...

wangxuwei
今天
1
0
MAC安装MAVEN

一:下载maven压缩包(Zip或tar可选),解压压缩包 二:打开终端输入:vim ~/.bash_profile(如果找不到该文件新建一个:touch ./bash_profile) 三:输入i 四:输入maven环境变量配置 MAVEN_HO...

WALK_MAN
今天
0
0
33.iptables备份与恢复 firewalld的9个zone以及操作 service的操作

10.19 iptables规则备份和恢复 10.20 firewalld的9个zone 10.21 firewalld关于zone的操作 10.22 firewalld关于service的操作 10.19 iptables规则备份和恢复: ~1. 保存和备份iptables规则 ~2...

王鑫linux
今天
2
0
大数据教程(2.11):keeperalived+nginx高可用集群搭建教程

上一章节博主为大家介绍了目前大型互联网项目的系统架构体系,相信大家应该注意到其中很重要的一块知识nginx技术,在本节博主将为大家分享nginx的相关技术以及配置过程。 一、nginx相关概念 ...

em_aaron
今天
1
0
Apache Directory Studio连接Weblogic内置LDAP

OBIEE默认使用Weblogic内置LDAP管理用户及组。 要整理已存在的用户及组,此前办法是导出安全数据,文本编辑器打开认证文件,使用正则表达式获取用户及组的信息。 后来想到直接用Apache Dire...

wffger
今天
2
0
HFS

FS,它是一种上传文件的软件。 专为个人用户所设计的 HTTP 档案系统 - Http File Server,如果您觉得架设 FTP Server 太麻烦,那么这个软件可以提供您更方便的档案传输系统,下载后无须安装,...

garkey
今天
1
0
Java IO类库之BufferedInputStream

一、BufferedInputStream介绍 /** * A <code>BufferedInputStream</code> adds * functionality to another input stream-namely, * the ability to buffer the input and to * sup......

老韭菜
今天
0
0
STM 32 窗口看门狗

http://bbs.elecfans.com/jishu_805708_1_1.html https://blog.csdn.net/a1985831055/article/details/77404131...

whoisliang
昨天
1
0
Dubbo解析(六)-服务调用

当dubbo消费方和提供方都发布和引用完成后,第四步就是消费方调用提供方。 还是以dubbo的DemoService举例 -- 提供方<dubbo:application name="demo-provider"/><dubbo:registry address="z...

青离
昨天
2
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部