文档章节

解密H264、AAC硬件解码的关键扩展数据处理

yang_danny
 yang_danny
发布于 2015/04/14 08:00
字数 1100
阅读 1172
收藏 25

    通过上一篇文章(http://my.oschina.net/u/2336532/blog/399058),我们用ffmpeg分离出一个多媒体容器中的音视频数据,但是很可能这些数据是不能被正确解码的。为什么呢?因为在解码这些数据之前,需要对解码器做一些配置,典型的就是目前流行的高清编码“黄金搭档”组合H264 + AAC的搭配。本文将讲述H264AAC的关键解码配置参数的解析,如果没有这些配置信息,数据帧往往不完整,导致了解码器不能解码。

  • H264的配置信息解析

    前面我们知道,ffmpegavformat_find_stream_info函数可以取得音视频媒体多种,比如播放持续时间、音视频压缩格式、音轨信息、字幕信息、帧率、采样率等。在信息结果中有一项扩展数据描述(avcodec.h文件中):

          AVCodecContext定义如下:

    如果视频流是H264,这个extradate里面就包含了H264的配置信息,这个扩展数据有如下定义:

    详细解释可以参考ISO-14496-15 AVC file format文档。里面最重要的就是NAL长度和SPSPPS数据和对应的长度信息。对该数据的解析在ffmpeg里面有现成的函数:ff_h264_decode_extradata,在我的项目里面是自己写的扩展数据解析。

  • AAC的配置信息解析及设置

    如果音频数据是AAC流,在解码时需要ADTS(Audio Data Transport Stream)头部,不管是容器封装还是流媒体,没有这个,一般都是不能播放的。很多朋友在做AAC流播放时遇到播不出声音,很可能就是这个原因导致。

    ADTS所需的数据仍然是放在上面的扩展数据extradata中,我们需要先解码这个扩展数据,然后再从解码后的数据信息里面重新封装成ADTS头信息,加到每一帧AAC数据之前再送解码器,这样就可以正常解码了。

    extradate数据定义如下:

     

        详细信息及说明请参考“ISO-IEC-14496-3 (Audio)”的AudioSpecificConfig部分。里面最重要的部分有采样频率、通道配置和音频对象类型,这几个一般都是AAC解码器需要的配置参数。

        这个数据在ffmpeg中也有相应的解码函数:avpriv_aac_parse_header。在我的项目中,我没有使用这个函数,而是自己实现的:

  • typedef struct
    {
          int write_adts;
          int objecttype;
          int sample_rate_index;
          int channel_conf;
    }ADTSContext;

  • int aac_decode_extradata(ADTSContext *adts, unsigned char *pbuf, int bufsize)
    {
          int aot, aotext, samfreindex;
          int i, channelconfig;
          unsigned char *p = pbuf;
     
          if (!adts || !pbuf || bufsize<2)
          {
                return -1;
          }
          aot = (p[0]>>3)&0x1f;
          if (aot == 31)
          {
                aotext = (p[0]<<3 | (p[1]>>5)) & 0x3f;
                aot = 32 + aotext;
                samfreindex = (p[1]>>1) & 0x0f;
               
                if (samfreindex == 0x0f)
                {
                      channelconfig = ((p[4]<<3) | (p[5]>>5)) & 0x0f;
                }
                else
                {
                      channelconfig = ((p[1]<<3)|(p[2]>>5)) & 0x0f;
                }
          }
          else
          {
                samfreindex = ((p[0]<<1)|p[1]>>7) & 0x0f;
                if (samfreindex == 0x0f)
                {
                      channelconfig = (p[4]>>3) & 0x0f;
                }
                else
                {
                      channelconfig = (p[1]>>3) & 0x0f;
                }
          }
     
    #ifdef AOT_PROFILE_CTRL
          if (aot < 2) aot = 2;
    #endif
          adts->objecttype = aot-1;
          adts->sample_rate_index = samfreindex;
          adts->channel_conf = channelconfig;
          adts->write_adts = 1;
     
          return 0;
    }

           上面的pbuf就是extradata

    接下来,再用ADTSContext数据编码为ADTS头信息插入每一个AAC帧前面:

  • int aac_set_adts_head(ADTSContext *acfg, unsigned char *buf, int size)
    {       
          unsigned char byte;
     
          if (size < ADTS_HEADER_SIZE)
          {
                return -1;
          }
         
          buf[0] = 0xff;
          buf[1] = 0xf1;
          byte = 0;
          byte |= (acfg->objecttype & 0x03) << 6;
          byte |= (acfg->sample_rate_index & 0x0f) << 2;
          byte |= (acfg->channel_conf & 0x07) >> 2;
          buf[2] = byte;
          byte = 0;
          byte |= (acfg->channel_conf & 0x07) << 6;
          byte |= (ADTS_HEADER_SIZE + size) >> 11;
          buf[3] = byte;
          byte = 0;
          byte |= (ADTS_HEADER_SIZE + size) >> 3;
          buf[4] = byte;
          byte = 0;
          byte |= ((ADTS_HEADER_SIZE + size) & 0x7) << 5;
          byte |= (0x7ff >> 6) & 0x1f;
          buf[5] = byte;
          byte = 0;
          byte |= (0x7ff & 0x3f) << 2;
          buf[6] = byte;
     
          return 0;
    }

  这个头部是固定的7字节长度,所以可提前空出这7个字节供ADTS占用。

  通过以上对H264AAC的扩展数据处理,播放各种“黄金搭档”的多媒体文件、流媒体、视频点播等都应该没有问题了。

 

  想第一时间获得更多原创文章,请关注个人微信公众平台:程序员互动联盟(coder_online),扫一扫下方二维码或者搜索微信号coder_online即可关注,里面有大量AndroidChromiumLinux等相关文章等着您,我们还可以在线交流。

        如需转载本文,请注明出处:http://my.oschina.net/u/2336532/blog

© 著作权归作者所有

共有 人打赏支持
yang_danny
粉丝 18
博文 23
码字总数 26453
作品 0
丰台
私信 提问
加载中

评论(2)

东辉在线
东辉在线
真的很棒
现在灬未来
现在灬未来
gghhh
使用librtmp进行H264与AAC直播

libx264 版本是 128 libfaac 版本是 1.28 1、帧的划分 1.1 H.264 帧 对于 H.264 而言每帧的界定符为 00 00 00 01 或者 00 00 01。 比如下面的 h264 文件片断这就包含三帧数据: 00 00 00 01 ...

Jerikc
2015/09/06
9.4K
3
解密FFmpeg播放track mode控制

上一篇文章(http://my.oschina.net/u/2336532/blog/400790)我们解决了在FFmpeg下如何处理H264和AAC的扩展数据,根据解出的NALU长度恢复了H264的起始码和AAC的ADTS头,这样一般来说播放是没有...

yang_danny
2015/04/19
0
0
解密FFmpeg播放状态控制内幕

上一篇文章(http://my.oschina.net/u/2336532/blog/400790)我们解决了在FFmpeg下如何处理H264和AAC的扩展数据,根据解出的NALU长度恢复了H264的起始码和AAC的ADTS头,这样一般来说播放是没有...

东辉在线
2015/04/21
0
0
iOS音频AAC视频H264编码 推流最佳方案

项目都是个人的调研与实验,可能很多不好或者不对的地方请多包涵。 1 功能概况 实现音视频的数据的采集 实现音视频数据的编码,视频编码成h264,音频编码成aac 实现音视频数据的发布,将编码...

人生好迈
2015/12/02
7.1K
3
VLC media player 2.1.5 发布,视频播放器

VLC 2.1.5 日前正式发布,主要是修复第三方库中的一些Bug和重要的安全问题。VLC 2.1.5修复了Windows平台MP3、MKV和硬件解码时可能出现的错误,还修复了OS X平台QTsound捕获和音频频道订阅存在...

oschina
2014/07/28
2.9K
9

没有更多内容

加载失败,请刷新页面

加载更多

C++ vector和list的区别

1.vector数据结构 vector和数组类似,拥有一段连续的内存空间,并且起始地址不变。 因此能高效的进行随机存取,时间复杂度为o(1); 但因为内存空间是连续的,所以在进行插入和删除操作时,会造...

shzwork
今天
3
0
Spring之invokeBeanFactoryPostProcessors详解

Spring的refresh的invokeBeanFactoryPostProcessors,就是调用所有注册的、原始的BeanFactoryPostProcessor。 相关源码 public static void invokeBeanFactoryPostProcessors(Configu......

cregu
昨天
4
0
ibmcom/db2express-c_docker官方使用文档

(DEPRECIATED) Please check DB2 Developer-C Edition for the replacement. What is IBM DB2 Express-C ? ``IBM DB2 Express-C``` is the no-charge community edition of DB2 server, a si......

BG2KNT
昨天
3
0
Ubuntu 18.04.2 LTS nvidia-docker2 : 依赖: docker-ce (= 5:18.09.0~3-0~ubuntu-bionic)

平台:Ubuntu 18.04.2 LTS nvidia-docker2 版本:2.0.3 错误描述:在安装nvidia-docker2的时候报dpkg依赖错误 nvidia-docker2 : 依赖: docker-ce (= 5:18.09.0~3-0~ubuntu-bionic) 先看一下依......

Pulsar-V
昨天
4
0
学习笔记1-goland结构体(struct)

写在前面:若有侵权,请发邮件by.su@qq.com告知。 转载者告知:如果本文被转载,但凡涉及到侵权相关事宜,转载者需负责。请知悉! 本文永久更新地址:https://my.oschina.net/bysu/blog/3036...

不最醉不龟归
昨天
4
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部