音频编码压缩分类:有损压缩(消除冗余信息)、无损压缩。
所谓冗余信息就是 人耳听觉范围外的音频信息以及被遮蔽掉的音频信息。
频域遮蔽效应:频率相近的几个声源中,强度高的声音可能会将其它低强度声音遮蔽。
无损编码(熵编码):哈夫曼编码,算法编码,香农编码。
音频编码过程:
AAC、OPUS、Ogg、Speex、iLBC、G.711等
音频编码质量对比:
AAC(advanced audio coding)由Fraunhofer IIS、杜比实验室、AT&T、Sony等公司共同开发,目的是取代mp3,AAC可以在比mp3文件缩小30%体积的前提下提供更好的音质。
最开始是基于MPEG-2的音频编码技术,MPEG-4标准出现后,AAC重新集成了其特性,加入了SBR技术和PS技术。
AAC编码规格:AAC LC(常用)、AAC HE V1、AAC HE V2(常用)
AAC LC(low complexity)低复杂度规格,码流128Kbps,音质好;
AAC HE(即AAC LC + SBR),码流在64Kbps左右;
AAC HE V2(即AAC + SBR + PS),码流在32Kbps左右。
SBR (Spectral Band Replication)频段复制,采用SBR进行分频处理,在低频段降低采样率,在高频段提高采样率,这样既能降低码率又能提高音质。
PS(Parametric Stereo)核心思想是双声道中的声音存在某种相似性,只需存储一个声道的全部信息,然后花很少字节用参数描述另一个声道和它不同的地方。
①ADIF格式:这种格式的AAC文件只在最开始的地方存有一个头(包括采样率、采样大小、声道数等信息),只能从开头位置开始解码,不能在音频数据中间开始;常用于磁盘文件中。
②ADTS格式:每个音频帧中都有一个小的头信息,帧前面有一个用于分隔的同步字,所以可以从音频流的任何位置开始解码(支持音频文件播放进度拖拽),类似于数据流格式。相比ADIF格式它的数据量会多一些。