跳动的音符——迈进数字音频的世界
[前言]
魏晋时的名士嵇康嗜好琴曲,因得罪权贵而遭戮,临刑前还忘不了弹奏一曲《广陵散》,曲终时不禁喟叹道:“《广陵散》于今绝矣!”

古代音乐要想流传下来多数是靠口传心授,少部分是记录在曲谱当中,所以很多都随着历史而湮没了。假使嵇康生活在当代,他应该不会担心《广陵散》会失传,因为记录音乐的方式实在太多了,尤其在这个数字化的时代,数字音频格式不胜枚举,本专题将带给大家数字音频的全面报道,在音乐的海洋你,是否真的全面了解过这些音频呢?音频格式有多少种类?他们分别有什么不同?
[数字音频基础介绍]
早期用模拟方式来记录音频,但它存在着复制失真和因介质磨损而失效的问题,为避免这些问题,数字音频出现了!将模拟声音数字化最早采用PCM编码,即是脉冲代码调制编码,它几乎是所有数字音频格式的始祖。由于模拟声音信号非常复杂,PCM需要通过采样、量化、编码三个步骤将连续变化的模拟信号转换为数字编码。
1、采样率和量化级
声音是一种能量波,而波是无限光滑的,波的弦线我们可以看成由无数点组成,由于存储容量的原因,数字编码过程中,只能对弦线的某些点进行采样。采样的过程就是抽取某点的频率值。在一秒中内抽取的点越多,获取得频率信息则越为丰富,为了满足人耳的听觉要求,需要至少每秒进行40K次采样,用40kHz来表示,这个40kHz就是采样率,如CD,就是使用44.1KHz的采样率。只有频率信息是不够的,我们还必须获得该频率的能量值并量化。图1中的正弦线代表原始音频;黄色的方格代表采样后得到的结果,二者越吻合说明采样结果越好。横坐标表示采样率;纵坐标是量化级。格子从左到右,逐渐加密,可见采样率越大则音质越有保证;同样,当纵坐标的单位越小则越有利于音质的提高,即采样量化级越大越好。

图1
2、有损压缩与无损压缩
存储1分钟采样率为44.1KHz,量化级为16bit,双声道的PCM编码的音频信号,需要10.34MB的空间,这显然太庞大了。要降低磁盘占用有两种途径,一是降低采样率,一是进行压缩。降低采样率会严重影响音质,因而是不可取的,为此,出现了各种压缩算法来对音频进行压缩。一谈到音频压缩就会提到有损压缩与无损压缩,实际上有损压缩和无损压缩也只是相对的。音频编码最多只能做到无限接近于自然界的信号,实际上,任何数字音频编码都无法做到完全还原自然的声音信号。在所有的数字音频编码中,PCM编码代表了最高的保真水平,因此,它被约定俗成为无损编码。我们而通常上讲的有损音频编码,只是相对于PCM编码而言的。
3、压缩率和码率
压缩率通常指音乐文件压缩前和压缩后大小的比值,用来简单描述数字声音的压缩效率。码率也称比特率,也是一种表示数字音乐压缩效率的重要指标,它表示记录音频数据每秒钟所需要的比特值(bit),通常用Kbps(即每秒1024bit)作为单位。CD中的数字音乐码率为1411.2Kbps,而MP3音频的码率在112Kbps~128Kbps时即可实现接近于CD的音质。
到目前为止,出现过的数字音频格式已经数不胜数了,有些还在广泛的使用,有些已经没有生命力了,我们这里所介绍的,当然是那些我们目前正在接触的,或者将来有可能接触到的音频格式。这里,我们根据它们出现的时间及存在的方式进行了简单的分类。
[早期数字音频格式]
(1)PCM 编码──老而弥坚的始祖
PCM 即Pulse Code Modulation(脉冲代码调制编码)的缩写,它可以算做数字音频的鼻祖。它的最大的优点就是保真度高,缺点就是体积庞大。常见的Audio CD就采用了PCM编码,一张光盘的容量只能容纳72分钟的音乐信息。PCM一般作为WAV文件的编码而存在,也有以PCM为扩展名的音频文件,不过比较少见。而最新DVD-Audio也是使用PCM编码,其指标相当高,采样率最高可达192KHz,量化级为24bit。
(2)WAVE格式──庞大的日不落帝国
WAV是一种古老的音频文件格式,由微软开发的,现在它已经成为了事实上的通用音频格式。实际上WAV格式是非常灵活的,它对音频流的编码没有硬性规定,除了PCM之外,几乎所有支持ACM(Audio Compression Manager)规范的编码都可以为WAV的音频流进行编码,如ADPCM、GSM、CCITT、G.723.1等等,甚至也包括MP3格式(如图2)。它的这个特性就如同视频文件中的AVI一样。在实际应用中,基于PCM编码的WAV还常常被当作一种中介格式,用于不同编码的相互转换当中,例如将MP3转换成Ogg格式。正因为这些原因,WAV格式虽然体态臃肿,却依然有着强大的生命力,成为数字音频中的日不落帝国。

图2
(3)AIFF/AU格式──割据一方的诸侯
AIFF是苹果电脑中的标准音频格式,属于QuickTime技术的一部分。它和WAV非常类似,实际上WAV格式就是由它克隆而来。不过AIFF远不如WAV盛行,但由于苹果电脑在多媒体领域里的领导地位,所以,大部的音频编辑软件和播放软件都对它提供了支持,可以说只要有Apple还存在一天,AIFF就不会消亡。AU则是Unix平台下一种常用的音频格式,起源于Sun 公司的Solaris系统。AU格式本身也支持多种压缩方式,但文件结构的灵活性就比不上AIFF和WAV。由于Unix平台比Mac平台更为阳春白雪,了解它的人并不多,因而,它得到的支持也远不如AIFF和WAV。
(4)MIDI──通向音乐创作的桥梁
MIDI文件本身只是一堆数字信号而已,不包含任何声音信息,它记录的是在音乐的什么时间用什么音色发多长的音等等。正因为这样,通常的MIDI文件个头都非常小。由于MIDI记录的并不是真正的声音,所以不同的声卡,不同软波表,不同硬件音源的音色是不相同的,相同的MIDI文件在不同的设备上播放会有不同的效果。普通的MIDI文件许多播放器都支持,但要达到好的效果就必须安装软波表,目前Microsoft已经在DirectX里面增加了软波表,使之成为Windows系统的标准配置了。MIDI文件的编辑软件主要有Cake Walk Pro、Sonar及国产的TT作曲家,MIDI在音乐创作中有着非常广泛的应用。
[新型数字音频格式]
(1)MP3──当今的江湖老大
MP3的名声之响绝对超过其它任何一种音频格式,因为它的应用范围早已经不限于电脑了。MP3是MPEG-1/MPEG-2 Audio Layer 3的简称,属于MPEG-1/2的派生音频方案。MP3采用的是一种有损压缩方式,虽然并不是第一个进行有损压缩的音频编码,但它却是第一个实用的有损音频压缩方案。在MP3之前,
