「专题速递」边缘降本、智能语音降本、提高压缩率、极速高清实践

原创
2023/11/16 20:44
阅读数 10

互联网的流量红利见顶后,音视频领域技术者纷纷寻求在维持卓越用户体验的前提下,降低运营成本的方法。然而,传统的网络基础设施难以满足日益增长的数据需求,存储、算力成本仍在持续攀升。因此,制定创新性的降本增效策略成为了当务之急。

在本专题中,我们将深入研究音视频领域内的降本增效实践,从中获得启发和技术思考。在本专题,我们将聆听和学习:多媒体的边缘网络以及智能语音系统如何帮助降本,争取更大的效益;并学习提高压缩率的原理和编解码技术的极速高清实践,以提升用户的流媒体体验。本专题旨在为技术者及企业提供实用的、可操作的建议,引领技术在降本增效的道路上走得更稳更远。

01

多媒体网络的边缘降本再探索

韩锐

字节跳动 超边缘设备网络负责人

字节跳动是全球范围内的音视频带宽用量大户,因此对降本有着长期且精益的诉求。

本次分享聚焦在多媒体降本的一项重要路径——边缘节点和边缘网络的潜力再挖掘。从超越边缘的视角,讨论几个行业内普遍关心的问题,包括:边缘降本下沉的边界在哪里?如何利用好越来越边缘化的设备?如何提供同等优质的体验、质量和能力?如何继续挖掘边缘的新业务价值?

本次分享将试图立足“多媒体网络如何超越边缘,服务业务降本”这一主题,在行业普遍经验的基础上,分享字节在点直播等场景,超越传统边缘过程中的工程经验、研究成果、以及组织变革努力。 探讨在极大用量、复杂业务的情形下,如何长期保障和优化全球降本的边际效益。

02

希沃智能语音的低成本落地实践

李波

希沃 AI Tech Leader

随着教育信息化的发展,音视频教学资料在迅速增加。与文本资料相比,音视频材料在学习过程中存在更大挑战,例如难以进行重复阅读、检索、批注和总结归纳等。因此,我们的多项产品旨在通过智能语音技术帮助用户更好地利用这些资料,使用户能够像使用文本资料一样有效地学习音视频内容。

而要打造出精度较高的智能语音系统,通常要投入数百万乃至千万的数据标注成本。希沃团队通过构建半监督学习系统,在海量的无标签数据上训练,以不到十分一的成本实现业界领先的语音识别系统。

03

转码系统究竟在优化什么?——提高压缩率的原理与实践

蔡春磊

哔哩哔哩 多媒体算法组 teamleader

建设包括画质评价、前处理、自适应转码策略、新一代编码器、终端增强等模块的内容自适应转码系统,是各大视频公司的重要工作。而压缩转码系统所涉及的技术种类繁多,各个模块的技术路线也各不相同,它们的优化方向和有效性是否能用同一套理论框架来解释?近几年,面向未来的深度学习视频图像编码技术,在短时间内达到了媲美最新传统编码的性能。而这两大类编码方法的优化原理是否也息息相关呢?其实这些工作都能被信息论中的两条定理所归纳和解释:

  1. 解码时,与信号相关的先验信息越多,剩余的条件熵就越小,编码所需码率就越低;

  2. 对信号概率分布的预测越准确,交叉熵就越小,编码所需码率就越低。

在能够对转码方法进行原理解释之后,即可指导B站的内容自适应转码系统的各个模块的设计与优化。以自适应转码策略为例,我们提出了一种画质可控的转码系统,其目的是提高逼近画质临界点的能力,最终我们的方法可以以99%的准确率,控制编码视频的画质,显著改善了画质体验,同时节省了数亿元的带宽成本。

04

shopee视频编码技术与极速高清最佳实践

范志兴

shopee 视频编解码tech leader

随着经济增长放缓,各大互联网公司都喊出了降本增效的口号,shopee也不例外。近2年,如何在降低带宽、算力成本的同时提高或者至少不降低用户的画质体验成了shopee 音视频技术团队最大的挑战。

本分享将带大家深入了解一下,shopee如何做到端到端的画质提升,以及带宽/算力成本节省的。我们结合了AI增强,采集端编码策略优化(软硬编码结合),后台转码优化(编码器bdrate提升,编码效率提升),播放端增强等技术达到了这一目的。

LiveVideoStackCon 2023音视频技术大会深圳站,诚邀您参与。

时间:2023年11月24日-25日

地点:深圳圣淘沙酒店(翡翠店)

咨询:13520771810(微信同号),ticket@livevideostack.com

展开阅读全文
加载中
点击引领话题📣 发布并加入讨论🔥
打赏
0 评论
0 收藏
0
分享
返回顶部
顶部