文档章节

科技解放生产力之语音转换文字

q
 qwerttaa
发布于 2017/08/15 16:49
字数 1033
阅读 2080
收藏 39

语音转写,顾名思义就是把语音转换成文本

在实际的应用场景中,可以是讲演转文稿,可以是在IM工具交流,等等等等

可以说,这项技术的出现,极大的解放了生产力,提高了工作、沟通效率

今天这里拿出一个实例,大家一起看一看在这个应用场景中语音转文本所带来的便利

对于记者朋友来说,一场发布会后整理出文字稿件永远是第一主题

在以前,他需要在现场录制音频,回到单位后一句一句听写,纯人工转写,随后再一次形成报道

那么现在,他可以在现场直接调用服务,实时把语音转换为文字。回到办公室,他可以根据文稿直接形成报道

也或者他依旧用录音笔录制了现场的录音,在回办公室的路上,他把音频文件通过软件转换到了文本稿件,同样的,回到办公室,他只需要根据文稿形成报道

了解了这样的案例,今天要介绍的主角就可以闪亮登场了

IBM Watson!

你可能以为它只是一个简单的语音转文本的服务(接口),其实,它是一个标准的计算机认知系统!

让我们把时间退回到2011年,当时有这样一则报道

“2011年,Watson 在美国最受欢迎的智力问答电视节目《危险边缘》(Jeopardy)中亮相,一举打败了人类智力竞赛冠军。如今,Watson 已经发展为一个商业化、基于云的认知系统,应用到各行各业中,逐渐让我们的生活变得更美好。”

在这样强大的基础之上,今天我们需要用到的是它的语音识别服务Speech to Text

首先作为一般使用者,大家可能最基础的使用环境就是刚刚案例中提到的那样,那么,IBM团队已经为大家提供了一个免费的可以立即使用的web端语言转文本程序

https://speech-to-text-demo.mybluemix.net/(如果你那边打不开,请用力!用力!我是说攀高儿过墙你懂的)

首先,大家可以看到输入音频的方式可以有两种,一个是调用设备的麦克风现场录制,一个是上传一个音频文件

在这里需要注意都是,上传的文件支持格式为.wav, .flac, .opus,这里说一句题外话,我们建议大家把本地录制的音频转码为opus格式,因为在低码率情况下,opus格式的音质会更强,这意味着你可以把你的音频文件压制的更加小巧而不会过多的损失音质更不会为此降低了IBM Watson的识别能力

其次大家在抓图中可能已经注意到,有一个识别模式的下拉选项,当前显示为英语。那么除了英语,让我们来看一下它还支持什么语言

清晰、一目了然,高亮选选择的就是大家的母语,普通话

那么我们可以试一下刚刚提到的两种录入方式,其中之一是上传已经录制好的音频文件

其次我们还可以直接实时录制语言转换为文字

这个语音转文本的简单演示大概就是这样。当然,作为开发者,你一定不满足于上边的演示demo,你可以免费注册Bluemix服务,在该服务中内嵌了Speech to Text 服务,你能够轻松的通过强大的接口和完整的文档来构建自己的应用,把Speech to Text部署到你自己的应用场景中

好了,让我们憧憬一下未来,更加便捷更加强大的服务在不断的出现,今天的梦想,明天的日常。

© 著作权归作者所有

共有 人打赏支持
q
粉丝 12
博文 21
码字总数 16694
作品 0
私信 提问
加载中

评论(5)

FutureElement
FutureElement
科大讯飞
zzuqiang
zzuqiang
这个真不错呀!以前一直用讯飞
泽润先生
泽润先生
好东西已收藏
q
qwerttaa

引用来自“锅锅”的评论

开元中国

回复@锅锅 : 被你发现了哈哈
官方人元
官方人元
开元中国

暂无文章

CTS测试流程及注意事项

一、测试前的准备 1.测试环境:在Linux系统下测试 安装SDK,JDK,ADB,Python工具包。 2.下载媒体文件包: 下载网站:https://source.android.com/compatibility/cts/downloads (在网页的最下方...

天王盖地虎626
9分钟前
0
0
技术码霸阐述——Spring Cloud Netflix:熔断器:Hystrix Clients

Netfilix创建了一个名为Hystrix的库,实现了熔断器模式。在微服务架构中,它通常有多个服务调用层。 一: 微服务图 一个底层服务的故障会引发直至用户交互层的连锁故障。在一个设定时长为“m...

java知识分子
15分钟前
0
0
CSS 学习笔记

# 1、CSS介绍 CSS 指层叠样式表 (Cascading Style Sheets),定义如何显示HTML元素。 CSS规则由两个主要的部分构成:选择器,以及一条或多条声明: p{color:red; text-align:left;} 其中p为选择...

davidwbnu
22分钟前
0
0
Git代码防丢指南

我们在日常使用Git的过程中经常会发生一些意外情况,如果处理不当,则可能会出现代码丢失的假象。本文将针对IDEA&Git日常开发中的一些场景,为你层层拨开迷雾,解析常见的错误及其发生原因,...

joymufeng
40分钟前
2
0
传统IDC部署网站(三)

16. chown命令 chown 用来更改一个文件或者目录的所有者护着所属组 -R 级联更改一个目录下所有的目录和文件 chown user1:users 1.txtchown user1.users 1.tx useradd 添加用户的命令 user...

miko0089
51分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部