文档章节

Facebook开源最先进的语音系统wav2letter++

l
 linux-tao
发布于 01/28 21:05
字数 638
阅读 6
收藏 0

最近,Facebook AI Research(FAIR)宣布了第一个全收敛语音识别工具包wav2letter++。该系统基于完全卷积方法进行语音识别,训练语音识别端到端神经网络的速度是其他框架的两倍以上。他们在博客中详细介绍了这个开源软件。

Facebook开源最先进的语音系统wav2letter++Facebook开源最先进的语音系统wav2letter++

由于端到端语音识别技术可以容易地扩展到多种语言并且同时保证在各种环境中的识别质量,因此通常认为它是一种有效且稳定的语音识别技术。虽然递归卷积神经网络在处理具有远程依赖性的建模任务(例如语言建模,机器翻译和语音合成)中占主导地位,但是循环架构是端到端语音识别任务的主流。

鉴于此,Facebook人工智能研究所(FAIR)的语音团队上周推出了第一个全卷积语音识别系统。该系统完全由卷积层组成,消除了特征提取步骤和仅训练端到端音频。预测波形中的转录文本,并且通过外部卷积语言模型对文本进行解码。然后Facebook宣布开源wav2letter++  - 这种高性能框架的出现,使端到端语音识别技术能够实现快速迭代,为未来的优化工作和模型调优奠定坚实的基础。

宣布开源wav2letter++,以及机器学习库Flashlight。 Flashlight是一个基于C ++的机器学习库,它使用ArrayFire张量库,并在C ++中实时编译,目的是最大限度地提高CPU和GPU后端的效率和规模。 wave2letter++工具包基于Flashlight基础构建。最重要的是,它也是用C++编写的,ArrayFire是张量库。

本节重点介绍ArrayFire,它可以在CUDA GPU和CPU支持的各种后端上执行,支持多种音频文件格式(如wav,flac等),并支持多种类型的功能,包括原始音频。线性缩放功率谱,对数梅尔谱(MFSC)和MFCC。

原文来自:https://www.linuxidc.com/Linux/2018-12/156060.htm

本文地址:https://www.linuxprobe.com/wav2letter-voice-system.html编辑:roc_guo,审核员:逄增宝

© 著作权归作者所有

共有 人打赏支持
l
粉丝 17
博文 848
码字总数 973800
作品 0
深圳
运维
私信 提问
Facebook强势发布开源语音识别工具包——wav2letter

     今日凌晨,Facebook AI研究中心宣布开源语音识别工具包wav2letter!这是一款简单高效的端到端自动语音识别(ASR)系统,wav2letter 实现的是论文Wav2Letter: an End-to-End ConvNet...

大数据文摘
2018/01/02
0
0
Facebook 开源语音识别工具包 wav2letter

Facebook AI 研究院近日开源了一款简单高效的端到端自动语音识别(ASR)系统 wav2letter,wav2letter 实现的是论文 Wav2Letter: an End-to-End ConvNet-based Speech Recognition System 和 ...

王练
2018/01/02
2.2K
1
Facebook 开源语音识别工具包wav2letter(附实现教程)

近日,Facebook AI 研究院开源了端到端语音识别系统 wav2letter,本文是该架构的论文实现,读者可据此做语音转录。 GitHub 地址:https://github.com/facebookresearch/wav2letter wav2lett...

uwr44uouqcnsuqb60zk2
2018/01/02
0
0
wav2letter++:基于卷积神经网络的新一代语音识别框架

虽然基于RNN的技术已经在语音识别任务中得到验证,但训练RNN网络需要的大量数据和计算能力。最近,Facebook的AI研究中心(FAIR)发表的一个研究论文,提出了一种新的单纯基于卷积神经网络(C...

汇智网教程
2018/12/27
0
0
业界 | Facebook 开源语音识别工具包wav2letter(附实现教程)

  选自GitHub   作者:Ronan Collobert等   机器之心编译   参与:李亚洲、刘晓坤      近日,Facebook AI 研究院开源了端到端语音识别系统 wav2letter,本文是该架构的论文实现...

机器之心
2018/01/01
0
0

没有更多内容

加载失败,请刷新页面

加载更多

linux shell使用代理

export http_proxy=http://proxyAddress:port export http_proxy=http://proxyAddress:port

萌萌哒的小萝卜
3分钟前
0
0
Krpano 插入视频/音频

视频 <hotspot name="videospot" url="%SWFPATH%/plugins/videoplayer.swf" alturl="%SWFPATH%/plugins/videoplayer.js" videourl="%SWFPATH%/image/video.flv|%SWFPATH%/......

华山猛男
6分钟前
0
0
el-select使用方法及遇到数据回显的坑

<el-select v-model="temp.lang" class="filter-item" placeholder="Please select"> <el-option v-for="item in langs" :key="item.value" :label="item.label" :value="item.value"/> </el......

BraveLN
8分钟前
0
0
百度贴吧自动签到

实现百度贴吧自动签到功能 1.编写签到Python脚本 2.服务器配置定时任务执行签到脚本

MrPei
13分钟前
0
0
windows nginx

之前一直是在linux上使用nginx,今天百度了一下,发现原来nginx在windows也有软件。 最近在研究jeecg-boot,现在越来越多的框架开始采用前后分离的模式了,看来也是时候跟进了。 nginx: dow...

miaojiangmin
18分钟前
0
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部