CS224n研究热点9 读唇术
博客专区 > hankcs 的博客 > 博客详情
CS224n研究热点9 读唇术
hankcs 发表于5个月前
CS224n研究热点9 读唇术
  • 发表于 5个月前
  • 阅读 1
  • 收藏 0
  • 点赞 0
  • 评论 0

腾讯云 新注册用户 域名抢购1元起>>>   

摘要:  知识共享署名-非商业性使用-相同方式共享:码农场 » CS224n研究热点9 读唇术
本文由码农场同步,最新版本请查看原文:http://www.hankcs.com/nlp/cs224n-lip-reading.html
CS224n研究热点9 读唇术
唇语翻译将视频处理为以嘴唇为中心的图片序列,给或不给语音,预测正在讲的话。这些数据可能来自新闻直播:动画演示:这里唇语和语音的识别、卡拉OK效果式的对齐,都是模型自动完成的。架构视觉和听觉两个模块或者混合交火或者单独使用,每次输出一个字母。视觉取嘴唇时序上的sliding window,先喂给CNN,再喂给LSTM,生成一个output vector$s$:var mathConfig = {jax: ["input/TeX", "output/HTML-CSS"], tex2jax: {inlineMat...

继续阅读码农场 » CS224n研究热点9 读唇术

原文链接http://www.hankcs.com/nlp/cs224n-lip-reading.html


感谢阅读本文,欢迎 查看原文或访问 码农场 获取更多内容

标签: CS224n
共有 人打赏支持
粉丝 28
博文 219
码字总数 53149
作品 1
评论 (0)
×
hankcs
如果觉得我的文章对您有用,请随意打赏。您的支持将鼓励我继续创作!
* 金额(元)
¥1 ¥5 ¥10 ¥20 其他金额
打赏人
留言
* 支付类型
微信扫码支付
打赏金额:
已支付成功
打赏金额: