文档章节

科技解放生产力之语音转换文字

q
 qwerttaa
发布于 2017/08/15 16:49
字数 1033
阅读 2024
收藏 39
点赞 5
评论 5

语音转写,顾名思义就是把语音转换成文本

在实际的应用场景中,可以是讲演转文稿,可以是在IM工具交流,等等等等

可以说,这项技术的出现,极大的解放了生产力,提高了工作、沟通效率

今天这里拿出一个实例,大家一起看一看在这个应用场景中语音转文本所带来的便利

对于记者朋友来说,一场发布会后整理出文字稿件永远是第一主题

在以前,他需要在现场录制音频,回到单位后一句一句听写,纯人工转写,随后再一次形成报道

那么现在,他可以在现场直接调用服务,实时把语音转换为文字。回到办公室,他可以根据文稿直接形成报道

也或者他依旧用录音笔录制了现场的录音,在回办公室的路上,他把音频文件通过软件转换到了文本稿件,同样的,回到办公室,他只需要根据文稿形成报道

了解了这样的案例,今天要介绍的主角就可以闪亮登场了

IBM Watson!

你可能以为它只是一个简单的语音转文本的服务(接口),其实,它是一个标准的计算机认知系统!

让我们把时间退回到2011年,当时有这样一则报道

“2011年,Watson 在美国最受欢迎的智力问答电视节目《危险边缘》(Jeopardy)中亮相,一举打败了人类智力竞赛冠军。如今,Watson 已经发展为一个商业化、基于云的认知系统,应用到各行各业中,逐渐让我们的生活变得更美好。”

在这样强大的基础之上,今天我们需要用到的是它的语音识别服务Speech to Text

首先作为一般使用者,大家可能最基础的使用环境就是刚刚案例中提到的那样,那么,IBM团队已经为大家提供了一个免费的可以立即使用的web端语言转文本程序

https://speech-to-text-demo.mybluemix.net/(如果你那边打不开,请用力!用力!我是说攀高儿过墙你懂的)

首先,大家可以看到输入音频的方式可以有两种,一个是调用设备的麦克风现场录制,一个是上传一个音频文件

在这里需要注意都是,上传的文件支持格式为.wav, .flac, .opus,这里说一句题外话,我们建议大家把本地录制的音频转码为opus格式,因为在低码率情况下,opus格式的音质会更强,这意味着你可以把你的音频文件压制的更加小巧而不会过多的损失音质更不会为此降低了IBM Watson的识别能力

其次大家在抓图中可能已经注意到,有一个识别模式的下拉选项,当前显示为英语。那么除了英语,让我们来看一下它还支持什么语言

清晰、一目了然,高亮选选择的就是大家的母语,普通话

那么我们可以试一下刚刚提到的两种录入方式,其中之一是上传已经录制好的音频文件

其次我们还可以直接实时录制语言转换为文字

这个语音转文本的简单演示大概就是这样。当然,作为开发者,你一定不满足于上边的演示demo,你可以免费注册Bluemix服务,在该服务中内嵌了Speech to Text 服务,你能够轻松的通过强大的接口和完整的文档来构建自己的应用,把Speech to Text部署到你自己的应用场景中

好了,让我们憧憬一下未来,更加便捷更加强大的服务在不断的出现,今天的梦想,明天的日常。

© 著作权归作者所有

共有 人打赏支持
q
粉丝 12
博文 21
码字总数 16694
作品 0
加载中

评论(5)

FutureElement
FutureElement
科大讯飞
zzuqiang
zzuqiang
这个真不错呀!以前一直用讯飞
泽润先生
泽润先生
好东西已收藏
q
qwerttaa

引用来自“锅锅”的评论

开元中国

回复@锅锅 : 被你发现了哈哈
首席CTO
首席CTO
开元中国

暂无文章

TensorFlow 作用域与操作符的受限范围

variable_scope 影响变量和操作符 name_scope 只影响操作符 with tf.name_scope(""),使用空字符串将作用域返回到顶层 tf.variable_scope("") 相当于添加一个空层 import tensorflow as tf...

阿豪boy
2分钟前
0
0
Java面试基础篇——第六篇:常见Map类的区别

常见的map类有: HashMap, ConcurrentHashMap (Jdk1.8) , LinkedHashMap, TreeMap, Hashtable。 其中我们最常用的莫过于HashMap, 和并发情况下使用的ConcurrentHashMap了,它们的主要区别就在...

developlee的潇洒人生
4分钟前
0
0
崛起于Springboot2.X之前端模版freemaker(23)

1、配置文件 spring: freemarker: allow-request-override: false cache: true check-template-location: true charset: UTF-8 content-type: text/html ......

木九天
20分钟前
1
0
spring-boot:run启动时,指定spring.profiles.active

Maven启动指定Profile通过-P,如mvn spring-boot:run -Ptest,但这是Maven的Profile。 如果要指定spring-boot的spring.profiles.active,则必须使用mvn spring-boot:run -Drun.profiles=test......

夜黑人模糊灬
22分钟前
0
0
大数据分析挖掘技术学习:Python文本分类

引言 文本分类作为自然语言处理任务之一,被广泛应用于解决各种商业领域的问题。文本分类的目的是将 文本/文档 自动地归类为一种或多种预定义的类别。常见的文本分类应用如下: • 理解社交媒...

加米谷大数据
27分钟前
0
0
istio-0.8 指标监控,prometheus,grafana

配置: https://istio.io/docs/tasks/telemetry/metrics-logs/ https://istio.io/docs/tasks/telemetry/tcp-metrics/ envoy拦截请求>上报mixer>对接prometheus>grafana 效果截图: promethe......

xiaomin0322
29分钟前
0
0
公众号推荐

阿里技术 书籍:《不止代码》

courtzjl
32分钟前
0
0
关于改进工作效率

1.给不同的业务线建立需求群,所有的数据需求都在群里面提。 2.对于特别难搞定的事情,到对应的技术哪去做,有问题随时沟通。 3.定期给工作总结形成方法论。 4.学习新的技术,尝试用新的方法...

Avner
38分钟前
0
0
关于thinkphp 框架开启路径重写,无法获取Authorization Header

今天遇到在thinkphp框架中获取不到header头里边的 Authorization ,后来在.htaccess里面加多一项解决,记录下: <IfModule mod_rewrite.c> Options +FollowSymlinks -Multiviews Rewrite......

殘留回憶
42分钟前
0
0
centos 使用yum安装nginx后如何添加模块 10

centos 使用yum安装nginx后如何添加模块 10 centos6.2版本,使用yum来安装了nginx,但是最近需要重新添加模块,所以就傻了,询问下有人知道怎么重新添加模块吗? PS:俺是新手,需要高手救助...

linjin200
45分钟前
1
0

没有更多内容

加载失败,请刷新页面

加载更多

下一页

返回顶部
顶部