文档章节

操作 Wave 文件(1): 关于 Wave 文件的基础知识与文件格式

涂孟超
 涂孟超
发布于 2014/09/26 15:33
字数 1055
阅读 11
收藏 0

最近准备学习 DirectSound、DirectMusic、DirectShow, 但刚一接触就碰到了关于 Wave 文件的诸多问题, 只好先回头学学 Wave 文件.

Wave 文件的基础知识

经常见到这样的描述: 44100HZ 16bit stereo 或者 22050HZ 8bit mono 等等.

44100HZ 16bit stereo : 每秒钟有 44100 次采样, 采样数据用 16 位(2字节)记录, 双声道(立体声);
22050HZ 8bit mono : 每秒钟有 22050 次采样, 采样数据用 8 位(1字节)记录, 单声道;

当然也可以有 16bit 的单声道或 8bit 的立体声, 等等.

人对频率的识别范围是 20HZ - 20000HZ, 如果每秒钟能对声音做 20000 个采样, 回放时就足可以满足人耳的需求. 所以 22050 的采样频率是常用的, 44100 已是 CD 音质, 超过 48000 的采样对人耳已经没有意义. 这和电影的每秒 24 帧图片的道理差不多.

每个采样数据记录的是振幅, 采样精度取决于储存空间的大小:
1 字节(也就是8bit) 只能记录 256 个数, 也就是只能对振幅做 256 种识别;
2 字节(也就是16bit) 可以细到 65536 个数, 这已是 CD 标准了;
4 字节(也就是32bit) 能把振幅细化到 4294967296 种可能性, 实在是没必要了.

如果是双声道(stereo), 采样就是双份的, 文件也差不多要大一倍.

这样我们就可以根据一个 wav 文件的大小、采样频率和采样大小估算出一个 wav 文件的长度; 譬如 "Windows XP 启动.wav" 的文件长度是 424,644 字节, 它是 "22050HZ / 16bit / 立体声" 格式(这可以从其 "属性->摘要" 里看到).
它的每秒的传输速率是 22050*16*2 = 705600(bit), 换算成字节是 705600/8 = 88200(字节);
424644(总字节数) / 88200(每秒字节数) ≈ 4.8145578(秒).

这还不够精确, 在标准的 PCM 格式的 WAVE 文件中还有 44 个字节是采样数据之外的内容, 应该去掉:
(424644-44) / (22050*16*2/8) ≈ 4.8140589(秒). 这比较精确了.

关于声音文件还有一个概念: "位速", 也有叫做比特率、取样率, 譬如上面文件的位速是 705.6kbps 或 705600bps, 其中的 b 是 bit, ps 是每秒的意思; 压缩的音频文件常常用位速来表示, 譬如达到 CD 音质的 mp3 是: 128kbps / 44100HZ.

Wave 文件的文件格式

微软的多媒体文件(wav、avi、tif 等)都有一个 RIFF 头, Wave 文件基本是这个样子:

RIFF 头
fmt 子块
data 子块


Wave 文件的编码方式有好多, 最常用最简单的就是 PCM 编码.

其他编码会包含更多的"块", 但至少会包含上面的块, PCM 编码只包含上面的块.

下面是 PCM 编码的祥表:

RIFF 头 ckid 4 "RIFF" 标识
cksize 4 文件大小; 这个大小不包括 ckid cksize 本身, 下面的子块大小也是这样
fccType 4 类型, 这里是 "WAVE" 标识
  24 fmt 子块 ckid 4 "fmt " 标识
cksize 4 块大小; PCM 编码这里是 16, 其他编码也不小于 16
wFormatTag 2 编码格式; 1 表示是 PCM 编码 
nChannels 2 声道数; 1 是单声道、2 是立体声
nSamplesPerSec 4 采样频率(每秒的样本数); 譬如 44100
nAvgBytesPerSec 4 传输速率 = 采样频率 * 每次采样大小, 单位是字节
nBlockAlign 2 每次采样的大小 = 采样精度 * 声道数 / 8(因单位是字节所以要/8);
这也是字节对齐的最小单位, 譬如 16bit 立体声在这里的值是 4 字节
wBitsPerSample 2 采样精度; 譬如 16bit 在这里的值就是 16
? data 子块 ckid 4 "data" 标识
cksize 4 块大小
采样数据 ? 双声道数据排列: 左右左右...; 8bit: 0-255, 16bit: -32768-32767


其他编码可能会包含的块有: 事实块(Fact)、提示块(Cue)、标签块(Label)、注释块(Note)、标签文本块(Labeled Text)、采样器块(Sampler)、乐器块(Instrument)、列表块(List)等等, 如果有 List 块, 它还会包含更多子块.

接下来要存取、播放、录制, 说来容易, 操作起来都挺麻烦.

本文转载自:http://www.cnblogs.com/del/archive/2009/11/06/1597088.html

涂孟超
粉丝 12
博文 2011
码字总数 14107
作品 0
深圳
程序员
私信 提问
痞子衡嵌入式:PCM编码与Waveform音频文件(.wav)格式详解

  大家好,我是痞子衡,是正经搞技术的痞子。今天痞子衡给大家介绍的是PCM编码及Waveform音频文件格式。   嵌入式里有时候也会和音频打交道,比如最近特别火的智能音箱产品,离不开前端的...

痞子衡
2018/08/12
0
0
flutter 绘制流水(水波上升)动态效果

欢迎去浏览原文:http://tryenough.com/flutter-wave 效果 你可以先简单理解下贝塞尔曲线的原理: 推荐这个关于贝塞尔的教程:http://www.html-js.com/article/1628 代码: 1.创建绘制波浪边...

TryEnough
04/26
0
0
【wav音频解析】之wavread函数的C++实现

本文由三部分组成,第一部分背景介绍 —— 音频类型及本文动机,第二部分类比matlab下wavread()函数的作用,第三部分则给出该函数的C++实现。 一 背景介绍 1.1 本文动机 1)所有wav音频处理的...

刘小米
2014/09/29
12.8K
8
音频编解码·格式篇(1)Wave PCM audio format(WAV)

音频编解码·格式篇(1)Wave PCM audio format(WAV) 作者:柳大·Poechant 博客:Blog.CSDN.net/Poechant 邮箱:zhongchao.ustc@gmail.com 日期:April 6th, 2012 0 音频编解码基础 采样率...

晨曦之光
2012/04/24
1K
0
语音编码的WAVE文件头格式剖析

WAVE文件头作为多媒体中使用的声波文件格式之一,它是以RIFF格式为标准的。RIFF是英文Resource Interchange File Format的缩写,每个WAVE文件的头四个字节便是“RIFF”。合理利用WAVE文件头可...

长平狐
2012/10/09
162
0

没有更多内容

加载失败,请刷新页面

加载更多

IT兄弟连 HTML5教程 HTML5表单 小结及习题

小结 HTML表单提交的方法有get方法和post方法,get方法的作用是从指定的资源请求数据,post方法的作用是向指定的资源提交要被处理的数据。HTML表单一直都是Web的核心技术之一,有了它我们才能...

老码农的一亩三分地
26分钟前
14
0
向maven工程中导入自己封装好的jar包方法

1.打开cmd窗口 输入并执行:mvn install:install-file -DgroupId=com.test   -DartifactId=ptest -Dversion=0.1  -Dfile=E:\test\test-0.1.0.jar    -Dpackaging=jar注:Dgr......

gantaos
28分钟前
3
0
【jQuery基础学习】09 jQuery与前端(这章很水)

本文转载于:专业的前端网站➨【jQuery基础学习】09 jQuery与前端(这章很水) 这章主要是将如何将jQuery应用到网站中,或者说其实就是一些前端知识,对于我这种后端程序来说其实还是蛮有用的...

前端老手
40分钟前
11
0
深度科技与金山云完成兼容互认证 共同促进我国软件生态发展

近日,深度科技与金山云完成兼容互认证工作,经双方共同严格测试,深度操作系统ARM服务器版软件V15与金山云分布式数据库软件DragonBase V1.0相互兼容、稳定运行,可以为企业级应用提供全面保...

后浪涛涛
40分钟前
8
0
Less导入选项

Less 提供了CSS @import CSS规则的几个扩展,以提供更多的灵活性来处理外部文件。 语法: @import (keyword) "filename"; 以下是导入指令的相关详情: reference,使用较少的文件但不输出。 ...

凌兮洛
56分钟前
16
0

没有更多内容

加载失败,请刷新页面

加载更多

返回顶部
顶部