第 2 章 关键原则

2.1 标准化原则: 数字音频的格式、解析度、载体和技术系统的选择要 符合国际标准, 满足档案的用途, 这是音频保存的组成部分。从长 期利用和未来格式转换的角度出发, 非标准化的格式、解析度和版 本不应被采用。

2.2 采样率原则: 采样率决定了响应频率的上限。在制作模拟音频材料 的数字拷贝时, IASA 建议对素材的最低采样率为48 kHz。然而更高 的采样率是可以达到的, 并且可能更适用于多类型的音频。尽管较 高的音频采样率超出了人类的听力范围, 但是这种高采样率和转换 技术的结果实际上提高了人类听觉范围内的音频质量。录音中无意 识产生的或不良的人为因素产生的杂音也是音频文件的一部分, 无 论它们是文件产生过程中固有的, 还是后来由于磨损、误操作或保 存不善的问题被添加到原件中的, 都必须保证保存的高度准确性。 对于某些特定的信号和某些类型的噪声, 采样率最好高于48 kHz。 IASA 建议采用96 kHz 作为更高的采样率, 虽然它被当作参照标准, 但并不是说这就是上限。然而, 对于大多数普通音频材料来说, 指 南中要求的采样率就足够了。对于原数字音频素材, 存储技术的采 样率应等于原素材的采样率。

2.3 位深度原则: 位深度决定了编码音频节目或素材的动态范围。 24 bit 音频编码的动态范围理论上接近人类听力的生理极限, 但是实际上系统技术的限制会稍微低一些。CD 标准的16 bit 音频可能不足以采集许多类型音频的动态范围, 特别是在编 码高电平的瞬间, 如受损唱片的转换。IASA 建议使用至少 24 bit 的编码速率来采集所有模拟音频材料。对于原数字音 频素材, 存储技术的位深度应至少等于原素材的位深度。在 录制过程中要非常谨慎, 以确保转换过程充分采集了整个动 态范围。

2.4 模数转换原则(A / D)

2.4.1 在将模拟音频转换为数字数据流时, A/ D 不应渲染音频或增加 任何额外的噪声。这是数字保存过程中最关键的部分。在实践 中, 计算机声卡中内置的A/ D 转换器由于低成本电路和计算机 中固有的电噪声而无法满足以上要求。IASA 建议使用具有AES/ EBU 或S/ PDIF 接口的独立A/ D 转换器, IEEE1394 总线连接 (火线) 独立A/ D 转换器或USB 串行接口独立A/ D 转换器, 并 根据以下参数进行模数转换。所有参数均在A/ D 转换器的数字 输出端测量, 并且符合音频工程学会标准AES 17 - 1998 (r 2004)、IEC 61606 -3 及相关标准。

2.4.1.1 总谐波失真+ 噪声(THD + N)
997 Hz 信号在-1 dB FS 时, A/ D 转换器THD + N 将低于-105 dB 未加权, -107 dB A 加权, 带宽范围是20 Hz ~20 kHz。
997 Hz 信号在-20 dB FS 时, A/ D 转换器THD + N 将小于-95 dB 未加权, -97 dB A 加权, 带宽范围是20 Hz ~20 kHz。

2.4.1.2 动态范围(信噪比)
A/ D 转换器的动态范围不得小于115 dB 未加权, 117 dB A 加权 (测量为相对于0 dB FS, 带宽范围为20Hz ~20kHz, 997 Hz 刺激 信号在-60 dB FS 时的THD + N)。

2.4.1.3 频率响应
对于48 kHz 的A/ D 采样频率, 在20 Hz ~20 kHz 范围内, 测量 的频率响应应优于 ±0.1 dB。
对于96kHz 的A/ D 采样频率, 在20 Hz ~20 kHz 范围内, 测量的 频率响应应优于 ± 0.1dB, 在20 kHz ~ 40 kHz 范围内应优 于±0.3 dB。
对于192 kHz 的A/ D 采样频率, 在20 Hz ~20 kHz 范围内, 测量 的响应频率应优于± 0.1 dB, 在20 kHz ~ 50 kHz 范围内应优于 ±0.3 dB (参考音频信号= 997 Hz, 振幅为-20 dB FS)

2.4.1.4 互调失真(SMPTE / DIN/ AES17)
A/ D 转换器的IMD 不会超过- 90 dB (AES17/ SMPTE/ DIN 双音 测试序列, 其音调组合相当于一个全振幅下的正弦波)。

2.4.1.5 振幅线性
A/ D 转换器将在-120 dB FS 至0 dB FS 的范围内呈现 ± 0.5 dB 的幅值线性度(997 Hz 正弦刺激)。

2.4.1.6 杂散A 谐波信号
在997 Hz, -1 dB FS 下, 刺激信号应优于-130 dB FS。

2.4.1.7 内置采样时钟精确度
与内置采样时钟同步的A/ D 转换器, 数字流输出端测量的时钟 频率精度将优于 ±25 ppm

2.4.1.8 抖动
在A/ D 输出端测量的接口抖动应小于5ns。

2.4.1.9 外同步
当A/ D 转换器采样时钟与外部参考信号同步时, A/ D 转换器必 须对输入的采样率做出明确响应, 输入的采样率变化范围不得超 过标称采样率的 ±0.2%。外部同步电路必须抑制进入的抖动, 使得同步的采样时钟不会受到人为因素的干扰。

2.4.2 IEE1394 和USB 音频接口。目前, 许多A/ D 转换器通过高速 IEEE1394 (火线) 和USB 2.0 串行接口可以直接与主机进行连 接。这两种接口成功利用了主流个人计算机平台, 可被用作音 频传输接口, 从而降低了在电脑机箱中配置高品质专用声卡接 口的要求。一般情况下, 音频质量与所用的总线技术无关。

2.4.3 A/ D 转换器的选择。A/ D 转换器是数字保存过程中最重要的技 术。选择转换器时, 在进行任何进一步评估之前, IASA 建议所 有参数都按照上述参考标准进行测试。任何不符合IASA 的基本 技术规范的转换器都实现不了精确的音频转换。结合技术评估, 对音频转换器进行初选, 然后在初选的基础上进行有效的盲听测 试, 确定其整体适用性和性能。上述所有参数和测试都是严格 的、复杂的, 这些参数在选择和评估模数转换器方面非常重要。 很难参照设备制造商发布的参数, 这些参数通常不完整, 有时还 不准确。这可能适合某些行业或团体开展小组测试和专家测试以 实现资源优化利用。某些机构能够协助测试, 如国家档案馆、图 书馆或学术科学部门。

2.5 声卡选用原则: 用于音频保存的计算机声卡应该具有可靠的数 字输入端, 具备数字音频流高质量的同步机制, 并且不会改变 数字音频流。由于必须使用独立A/ D 转换器, 音频保存中使用 声卡的主要目的是将数字信号传递到计算机数据总线, 但是出 于监控目的, 也可用于将转换后的数字信号还原成模拟信号。 在选择声卡时必须注意, 声卡要支持适宜的采样率和比特率, 而且不能有噪声或者人为产生的无关杂音混入。IASA 建议使用 符合以下参数的高品质声卡。

2.5.1 支持的采样率: 32 kHz ~192 kHz, ±5%。
2.5.2 数字音频量化(位深度): 16 ~24 bits。
2.5.3 变速(字时钟): 随音频输入和字时钟自动变化。
2.5.4 同步: 内部时钟、字时钟、数字音频输入。
2.5.5 音频接口: 符合AES 3 规范的高速AES/ EBU。
2.5.6 输入端的抖动消除和信号恢复速度达到100ns 且无误差。
2.5.7 数字音频子码通道。
2.5.8 可选的时间码输入。

2.6 计算机系统和处理软件选用原则: 近几代计算机已经具有足够 的能力来处理大型音频文件。一旦进入数字环境, 应保持音 频文件的完整性。上文提到关于音频文件保存过程的几个关 键点是将模拟音频转换为数字音频(利用A/ D 转换器), 并 通过声卡或其他数据端口将音频数据输入系统。然而, 有些 系统为了进行传输会将字长截短, 导致有效比特率降低, 而 有些系统只处理压缩文件格式(如MP3), 这两种情况都是 不能接受的。IASA 建议使用基于计算机的专业音频系统, 该 系统字长处理能力应超过文件字长(即大于24bit), 并且不 改变文件格式。

2.7 数据缩减原则: 在音频存档中普遍认为, 当选择数字目标格 式时, 不得使用基于感知编码(有损编解码器) 的包含数据 缩减的格式(通常被误称为数据 "压缩")。使用这种数据缩 减进行音频转换意味着部分原始信息将彻底丢失。这种数据 缩减的结果可能听起来与未缩减(线性) 的信号一样或者类 似, 至少对于首次复制的音频文件来说是这样, 但是数据缩 减的信号在后续使用时将受到严重限制, 而且已经不具备档 案的完整性。

2.8 文件格式选用原则

2.8.1 用于音频编码的格式种类很多。某种格式在专业音频环境中的 应用越广泛, 其长期使用的可能性越大, 在必要时将该格式转 化为未来的文件格式而研发专业工具的可能性也越大。由于线 性脉冲编码调制(PCM) [立体声交错] 的简单性和普遍性, IASA 建议使用由Microsoft 和IBM 开发的WAVE (文件扩展 名.wav) 作为资源交换文件格式(RIFF) 的扩展。Wave 文件 广泛应用于专业音频行业。

2.8.2 BWF.wav 文件[EBU Tech 3285] 是.wav 文件的扩展, 并且受 到最新的音频技术支持。BWF 用于存档和制作的好处是可以 将元数据嵌入头文件中作为文件的一部分。这对大多数基本 的交换和存档情况是有利的; 然而, 在复杂的大型数据管理 系统中, 内嵌信息的不可变性有可能成为不利因素(见第3 章 "元数据" 和第7 章 "小规模数字存储系统的解决方 案")。解决BWF 的这种缺陷和其他问题, 可以通过尽量少 用BWF 来维护数据, 大部分数据则使用外部数据管理系统来 维护。《AES 标准: 网络和音频文件传输- 音频文件传输和 交换- 在不同类型和品牌的系统间传输数字音频数据的文件 格式》(AES31 - 2 - 2006) 与BWF 标准兼容, 随着技术不 断发展, 希望BWF 格式依然可用。档案行业广泛接受BWF 格式, 且了解该格式的限制, 所以IASA 建议BWF.wav 文件 [EBU Tech 3285] 可用于存档。

2.8.3 多轨音频、电影或视频音轨、大型音频文件可能会使用RF 64 格 式[EBU Tech 3306], 该格式兼容BWF、AES31 或封装在素材 交换格式(MXF) 中的.wav 文件。由于以上技术仍在开发中, 目前, 一种实用的方法可能是创建 "tar" (源于tape archive) 格 式来封装多个时间相干的单声道BWF 文件。

2.9 音频路径选择原则: 重放设备、信号电缆、混音器和其他音频 处理设备组合后, 整个系统应在采样率和位深度方面等于或超 过数字音频的参数要求。使用的重放设备、音频线路、目标格 式和标准必须优于原始载体。


① “SMPTE” 即美国电影电视工程师协会。