AI语训、数字老爸、沙漠种树机器人,用AI传递科技温度

原创
01/08 11:01
阅读数 26

“我们最开始认识是起源于2023年10月14日的一场黑客松比赛,就从那个时候一路走到现在。能够参加到这个团队,也说明我们是有一定共识在里面的,我们不约而同地选择了这个事情来做。”

声桥团队唐璇口中的“这件事”,指团队成员李朋程的一个需求:能不能用AI帮听障人士学说话?因为很多听障人士要想通过康复师来“学说话”,一个月最少需要5000元,他很小心地说到,很多人负担不起。

“国产人工耳蜗售价20多万元,只要这个技术被做出来,就能帮助很多人”

由于遗传原因,来自内蒙古的李朋程出生时便失去了听力。尽管儿子被确诊为重症耳聋,但李朋程妈妈还是希望他提高文化水平,于是带他到北京读书。

初中毕业后,因学籍等客观原因,妈妈不得不带着李朋程离开北京,几经辗转供他读到了高三。遗憾的是,由于学籍档案出了问题,李朋程没能参加高考,学历止步于高中。

进入社会,李朋程发现以自己学历和身体状况很难就业,便下决心自力更生。借助父母“赞助”的5000元创业基金,他用1个月时间,自己开发了5门面向听障高中的线上课程,帮30多名高中生学习了一些技能。

图/《静雪》

然而,资金很快告罄,这次创业宣告结束。后来,他关注到科技和AI对听障人群的帮助,将目光投向手语转文字、虚拟数字人等项目,却都因各种各样的问题,没有取得成功。

时间来到2019年,一家重庆的科技公司展现出跟李朋程近似的理念。他看到后立即前往重庆,加入这家公司从事运营工作,策划并举办了许多针对听障群体的活动,参与者共计2000多名。

2021年,李朋程跳槽到一家做AR眼镜的公司。当时,这家公司正在开发一款将语音转换成文字,连接在眼镜上的产品,使听障人士能够用“看”,来明白他人所说的话。

图/unsplash

之所以出现这样的产品,是因为听障人群戴上助听器之后,并不能马上听懂别人在说什么。

唐璇解释道:“首先,他们要学习声音的含义,也就是辨别不同的声音,比如哪些声音是拍手,哪些声音是讲话。然后,他们要学习说话,也就是弄清语句的意思。”

离职后,李朋程已经认清,现有技术无法有效地帮助自己,他要自己学会说话——这也是绝大多数听障人士的终极梦想。

失聪20多年,李朋程终于用积蓄装上了人工耳蜗。他一边在关爱听障人群的机构做志愿者,一边赚钱负担自己报名语言学习课程的学费。

对于不同类型的听障人群,学听话和学说话的难度不尽相同。轻度听障能听到多数声音,学习起来相对容易;中度听障能听到部分声音;重度听障则什么都听不到,所以学习起来更加困难。

图/《静雪》

2022年植入人工耳蜗后,李朋程便可以听到声音了。

不过,唐璇说:“在黑客松和大家交流时,语音转文字技术能帮他理解大家说的话,但不是全部。一旦出现多人说话,或语速快、有口音的情况,转换就会失准。”

1998年出生的唐璇是北京科技大学机械工程研究生,她是跟理论物理专业毕业,从事金融量化研究的老朋友GGC,一起利用闲暇时间,报名参加黑客松比赛的。

当他们被李朋程的需求吸引时,武汉大学物理学专业Chortine,以及和她一起报名参赛的朋友,也对此产生了兴趣。

Chortine被AI的火爆勾起了用技术改变生活的想法,“想去亲身参与这个事情”。

她们俩和伙伴们都觉得,李朋程的需求“是一个应用性很强的场景,只要这个技术被做出来,就能帮助很多人”。

第二次全国残疾人抽样调查数据显示,我国听力障碍残疾人数约2780万。

目前,国产人工耳蜗售价20万元左右,语言学习课程和康复课程前后下来至少要花费十几万元,学习耗时4年,其后是漫长的康复过程。

“线下课程成本非常高,我们希望能开发一个用AI技术帮助他们进行纠音的产品。”唐璇补充道,“就是先识别他们的语音,针对其中不清楚或错误的部分,用AI给出具体的建议,指导他们如何修改和进步。”

团队就这样组建起来,几位95后将其命名为“声桥”。这款旨在帮听障人士学说话的产品,则被称为“声桥AI语训”。

在百度文心大模型的帮助下,声桥AI语训实现了团队的创想,能够在对比使用者的发音和标准发音后,以文字形式给出正确发音的针对性指导。

李朋程的本职工作是在一家听障康复机构担任公益项目专员。在Chortine眼中,“他是团队推动者一样的存在”;唐璇则觉得,“他行动力极强,敢于走出舒适圈,接触更多的人,非常令人敬佩”。

虽然不是技术专家,也不能正常说话,但每次开会李朋程都很积极,“能为团队的产品提供用户视角,还能帮忙对接听障社群资源,促成康复机构的交流与合作”。

正如唐璇所言:“我现在出来做这件事情,跟我以往上学上班做任何事情的感觉都不一样。不仅仅是因为做这件事情的使命感,还有一个是因为我们这个团队。经过这几个月,能从彼此身上学到很多东西,也很有力量。”

“13岁少年, 我要给妹妹打造一个‘数字老爸’”

唐璇所说的“力量”,是事业伙伴之间彼此激励的力量,也是热爱编程与开发的10后少年张熠墨,在电影《流浪地球2》中感受到的AI与科技的力量。

“既然AI还是比较成熟的,要是我也把一个人复制到计算机里面去,会怎么样?”

那天,熠墨像往常一样在家忙着自己的课业,视线却不自觉被一旁的妹妹吸引。因为爸爸老张在外奔忙,妹妹想要爸爸陪伴自己的小心愿落了空,似乎有些沮丧。

能不能效仿电影里的“数字丫丫”,“复制”一个“数字老爸”,让它陪妹妹聊天呢?老张回家后,听到了熠墨的这个创想。

图/《流浪地球2》

“在技术层面上,阻力不是特别大。”老张当即决定,和儿子一起开发这个名为“AI数字生命”的项目。

“熠墨原来没有太多项目经验,但是有了AI的支持以后,很多我们俩都不懂的东西,基于AI的知识可以很快解决问题。”老张说道。

熠墨和AI的缘分来得比多数孩子更早。

在他只有三年级的时候,爸爸妈妈给他报了一个学习机器人制作的兴趣班。后来,学习内容开始涉及编程,妈妈就又给他报了C++编程课,作为辅助。后面是在学校和广州市越秀区少年宫的老师指导下专注学习c++算法编程直到现在。

原本,老张夫妻俩只是抱着培养孩子兴趣的想法,岂料小熠墨就此爱上了编程。等老张回过头来关注儿子这方面的学习时,他看到小熠墨解的算法题,竟然超出了自己身为产品的能力范围。

“那时候应该都到五年级了,我就发现他的能力超出我的预期,我才发现这家伙不得了!”

如今回想起来,老张仍是惊叹:“我那时候才花时间和精力,陪他一起去看他的C++算法题,跟他在项目上多交流。”

也是从那时候起,熠墨开始利用AI技术,尝试做一些开发,而老张也加入了学习AI技术的行列。每当熠墨遇到自己和爸爸都难以解决的问题,他就会“问问AI,问问百度文心一言”。

“问”的过程中,熠墨发现,这些前沿科技能随时待命、解答即时,帮使用者提高效率。

而且,它们还具备一定的独立思考能力,“也会为我们的生活带来一些改变,比如说有时候和它聊聊天,也许能改变你的心情”。

之后,日子就像插上了科技的翅膀,飞得又快又高。熠墨的表达欲亦然。

以前,他是个不太爱说话的内向孩子,跟爸爸一起做开发之后,他们之间的共同话题越来越多,从科幻小说、科技资讯,到IT创新、技术突破等无所不谈,用老张的话说,“亲子关系变得非常好”。

但最好的关系不是美玉无瑕,而更像琥珀,一些意想不到的“小插曲”,反而使其增色。

正如熠墨和老张搭档的历程,讨论有时,纠结有时,争执有时,却因为“都是对事不对人”,不仅不会激发矛盾,反而让他们在更加理解彼此的同时,成为了更好的自己。

“他有他的认知和理解,而且很多时候我是被他说服的。”

老张笑着说:“因为我总是拿一些大道理去压他,他可能就逼着我自己检讨和思考一下,会不会我确实武断了,其实还有一些新的可能。那这个时候我就选择退一步,然后尝试一下。”

“我们俩除了原子弹不能造, 什么都能造”

开发AI数字生命期间,熠墨和老张一如既往,一个负责技术开发,另一个负责产品设计。

这时候,熠墨刚升入初一,周一至周五住在学校,周末回家时既要完成作业,也要上网课,所以只能在这两天里抽出4—6小时用于开发。

利用两周的两个周末,父子俩在百度文心一言的帮助下,对AI数字生命进行了“思想训练”,创造出一个能参与互动,而且有自主思维的“新生命”。

目前,AI数字生命不仅能像“数字老爸”一样,代替不在家的父母陪伴孩子,或者以留存形象、音视频等形式,延续离世之人的“生命”,还能生成数字生命形态的族谱,作为家族传承。

而且,一些特定职业的人也可以生成自己的AI数字生命,比如律师、教师、咨询师,甚至医生。这样一来,在无法亲自现身,或亲临现场的情况下,依然可以用自己的知识、技术和思想,来帮助别人。

为了学习AI技术和开发项目,熠墨付出了几乎全部的课余时间和大量精力。可是,他从未将付出看作“牺牲”,因为AI和开发是他的兴趣和乐趣所在,“所以不会因为累而不快乐”。

对儿子这方面的兴趣,老张夫妻俩的态度是包容而支持的,尤其是老张,考虑得非常超前:“我们对他未来的可能性的预期就多了很多,不担心他走独木桥。”

老张觉得,他和熠墨非常擅长基于AI和IT技术,解决各行各业的问题,虽然开发期间也会遇到困难,但他们一直是激情、默契而高效的。

“以至于让我产生了‘我们俩除了原子弹不能造,什么都能造’的感觉,因为现在AI真的太方便了。”老张骄傲地说。

今天,声桥团队与熠墨、老张共有的科技,改变与爱的力量,将千千万万个和他们一样的开发者聚在一起。

譬如襄阳段铁路95后一线员工李桑郁,他使用百度飞桨,顺利完成车号识别系统的全流程开发,在车间作业中大幅提高了审核效率,每年为襄阳车辆段节省了数十万元的成本。

还有大学生高鸿志,他曾带领团队利用飞桨打造沙漠种树机器人,现已投入实验并具备了在沙漠种树的能力,为沙漠治理提供全新可能。

以及谢菲尔德大学博士生彭煦潭,他曾利用飞桨AI技术能力,开发出“汉语-少数民族语言”词典,实现了汉语和少数民族语言之间的翻译。

像他们一样利用前沿科技,改变世界的开发者还有很多。他们是如此不同:成长背景、兴趣爱好各异,开发出的产品和技术被应用在不同领域,让不同的人群获益,为生活带来不同的改变。他们又如此相同:都拥有创想、改变与爱的力量,都在百度飞桨平台成长、成就,被世界看见。更重要的是,他们都相聚在国内最早关注深度学习开发者的大会——WAVE SUMMIT+深度学习开发者大会2023上,再次彼此激励,互相给予用科技创造美好生活的力量。明天,这群充满力量的开发者将回到各自的生活和事业中去。但力量的余波不会消散,追梦的脚步不会停歇。未来,将有越来越多的人,像他们一样拥抱AI,拥抱科技,拥抱更新更美的生活。

文章转载自新周刊

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部