文档章节

CS224n研究热点11 深度强化学习用于对话生成

hankcs
 hankcs
发布于 2017/07/07 21:00
字数 301
阅读 2
收藏 0
本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-deep-reinforcement-learning-for-dialogue-generation.html
CS224n研究热点11 深度强化学习用于对话生成
这篇论文研究如何训练聊天机器人进行有意义的对话,常规方法是seq2seq:与上几次课讲的机器翻译框架相同,encoder与decoder,相同的极大似然估计目标函数。seq2seq的缺陷 通过该方法训练出来的聊天机器人容易陷入死循环,比如让两个机器人聊天,本来聊得好好的:但一两句话之后就会重复相同的内容:其问题在于,红方“ I’m 16”缺乏指导性,没有给蓝方继续对话的话题。而“ I don’t know what you’re talking about”又是个太宽泛的大废话...

继续阅读码农场 » CS224n研究热点11 深度强化学习用于对话生成

原文链接http://www.hankcs.com/nlp/cs224n-deep-reinforcement-learning-for-dialogue-generation.html


感谢阅读本文,欢迎 查看原文或访问 码农场 获取更多内容

© 著作权归作者所有

共有 人打赏支持
hankcs
粉丝 36
博文 222
码字总数 53918
作品 1
美国
私信 提问
AI 研习社大讲堂已逾 100 期!精彩 NLP 分享视频回顾

机器学习、人工智能领域的研究人员,以及任何学术研究人员,都关心这两件事:分享、传播自己的研究成果让更多人知道,以及了解自己研究方向的最新进展、结识更多的研究人员。雷锋网(公众号:...

孔令双
11/28
0
0
专家齐聚讲述人工智能时代的自然问答、聊天机器人与自然语言理解

在人工智能时代,以自然语言理解为核心技术的问答、对话、聊天机器人已经成为产业界和学术界的关注热点。其中的关键技术包括:自动问答、对话管理、自然语言生成、机器翻译、文本语义匹配、用...

玄学酱
2017/11/02
0
0
NLP&深度学习:近期趋势概述(二)

递归神经网络(RNN) RNN是专门用于处理顺序信息的神经网络的方法。RNN将计算应用于以先前计算结果为条件的输入序列。这些序列通常由固定大小的标记向量表示,他们被顺序送至循环单元。下图说...

【方向】
09/20
0
0
哈工大刘挺:哈工大 SCIR 实验室的 NLP 研究 | CCF-GAIR

雷锋网 AI 科技评论按:近期由中国计算机学会(CCF)主办,雷锋网、香港中文大学(深圳)承办的全球人工智能与机器人峰会(CCF-GAIR)将于 6 月底在深圳举办,其中 哈尔滨工业大学刘挺教授 ...

camel
06/02
0
0
ACL 2018 首日:8 大 tutorial,深度强化学习最受关注 | ACL2018

雷锋网(公众号:雷锋网) AI 科技评论按:继 2017 年的温哥华之旅后,ACL 2018 在澳大利亚墨尔本举办,举办地点为墨尔本会展中心,也是 IJCAI2017 举办地。 今天是大会 tutorial 环节,虽然主...

思颖
07/15
0
0

没有更多内容

加载失败,请刷新页面

加载更多

zookeeper配置与使用

一.登录官网下载 不要带后缀的,那是公侧版本,下稳定版,比如3.4.9 二.安装与使用 解压后bin里是启动程序 配置文件:在conf下 复制zoo_sample.cfg改名为为zoo.cfg,打开zoo修改文件...

小兵胖胖
25分钟前
1
0
spring源码阅读笔记(一)

ClassPathXmlApplicationContext 与 FileSystemXmlApplicationContext 用了这么久的框架,是时候搞一下源码了,一般最初接触spring 从以下步骤开始 创建一个bean类 并创建 ooxx.xml之类的spr...

NotFound403
49分钟前
2
0
MySQL主从配置

12月14日任务 17.1 MySQL主从介绍 17.2 准备工作 17.3 配置主 17.4 配置从 17.5 测试主从同步 MySQL主从介绍 MySQL主从又叫做Replication、AB复制。简单将就是A/B两个服务器做主从后,在A上写...

robertt15
51分钟前
8
0
我的Linux系统九阴真经

在今天,互联网的迅猛发展,科技技术也日新月异,各种编程技术也如雨后春笋一样,冒出尖来了。各种创业公司也百花齐放百家争鸣,特别是针对服务行业,新型互联网服务行业,共享经济等概念的公...

问题终结者
今天
22
0
Java 使用 gson 对 json 根据 key 键进行排序

引入Google的gson jar <dependency> <groupId>com.google.code.gson</groupId> <artifactId>gson</artifactId> <version>2.8.0</version>......

yh32
今天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部