文档章节

CS224n研究热点9 读唇术

hankcs
 hankcs
发布于 2017/06/30 17:27
字数 252
阅读 4
收藏 0
本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-lip-reading.html
CS224n研究热点9 读唇术
唇语翻译将视频处理为以嘴唇为中心的图片序列,给或不给语音,预测正在讲的话。这些数据可能来自新闻直播:动画演示:这里唇语和语音的识别、卡拉OK效果式的对齐,都是模型自动完成的。架构视觉和听觉两个模块或者混合交火或者单独使用,每次输出一个字母。视觉取嘴唇时序上的sliding window,先喂给CNN,再喂给LSTM,生成一个output vector$s$:var mathConfig = {jax: ["input/TeX", "output/HTML-CSS"], tex2jax: {inlineMat...

继续阅读码农场 » CS224n研究热点9 读唇术

原文链接http://www.hankcs.com/nlp/cs224n-lip-reading.html


感谢阅读本文,欢迎 查看原文或访问 码农场 获取更多内容

© 著作权归作者所有

共有 人打赏支持
hankcs
粉丝 36
博文 222
码字总数 53918
作品 1
美国
私信 提问
CS224n研究热点15 Neural Turing Machines

目录 问题 记忆是解决方案吗 Neural Turing Machines 如何读写 读内存 写内存 attention更新 第一步 第二步 第三步 效果 References 这次讲座覆盖了来自DeepMind的两篇论文: 第二篇是第一篇...

码农场
2017/07/14
0
0
李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程

from : http://blog.csdn.net/dQCFKyQDXYm3F8rB0/article/details/79136408 hinton 深度学习课程:https://www.coursera.org/learn/neural-networks/home 目前,深度学习和深度强化学习已经在......

p312011150
05/11
0
0
李飞飞、吴恩达、Bengio等人的15大顶级深度学习课程,你收集全了吗?

AI技术年度盛会即将开启!11月8-9日,来自Google、Amazon、微软、Facebook、LinkedIn、阿里巴巴、百度、腾讯、美团、京东、小米、字节跳动、滴滴、商汤、旷视、思必驰、第四范式、云知声等企...

AI科技大本营
10/27
0
0
谷歌 AI:语义文本相似度研究进展

雷锋网按:本文为雷锋字幕组编译的技术博客,原标题 Advances in Semantic Textual Similarity,作者为 Google AI 的软件工程师与技术主管 Yinfei Yang。 翻译 | 张韵晨 马力群 整理 | 凡江 ...

雷锋字幕组
06/13
0
0
Coding and Paper Letter(三十)

资源整理,接上篇,本篇是论文。 Paper: 1.Assimilating multi-source remotely sensed data into a light use efficiency model for net primary productivity estimation/将多源遥感数据同......

胖胖雕
10/04
0
0

没有更多内容

加载失败,请刷新页面

加载更多

程序员,你焦虑吗?

前言 我很焦虑,请问程序员们,你焦虑吗? 我是一名年过35的北漂程序员,我身边的朋友大多也是程序员。我总感觉到30岁以上的程序员充满了焦虑。“华为清退35岁以上老员工”、“中兴程序员坠楼...

Ala6
18分钟前
1
0
RabbitMQ+PHP 教程一(Hello World)用yii2测试通过

介绍 RabbitMQ是一个消息代理器:它接受和转发消息。你可以把它当作一个邮局:当你把邮件放在信箱里时,你可以肯定邮差先生最终会把邮件送到你的收件人那里。在这个比喻中,RabbitMQ就是这里...

hansonwong
23分钟前
0
0
Netty原理分析往这边看!

Netty是一个高性能、异步事件驱动的NIO框架,它提供了对TCP、UDP和文件传输的支持,作为一个异步NIO框架,Netty的所有IO操作都是异步非阻塞的,通过Future-Listener机制,用户可以方便的主动...

Java干货分享
27分钟前
2
0
在Scala中构建Web API的4大框架

Scala是一种强大的语言,很快就成为许多开发人员的最爱。然而,语言只是一个起点-并非每个函数都将由语言核心覆盖。Scala还创建了一些厉害的框架。接下来看看Scala的4个强大框架以及其优点和...

数据星河
30分钟前
0
0
天猫双 11 背后:409 亿次安全保护,全链路保障每个购物场景

2135 亿元!2018 天猫双 11 再次刷新纪录。 这一数字背后,为了让用户更畅快买买买,一个简单的点击下单过程,就有百余项阿里安全技术在保驾护航:全天拦截 16 亿次恶意攻击、保护 409 亿次用...

Mr_zebra
37分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部