比7.1.2 声道更加栩栩如生的Dolby Atmos 到底是什么?大家都在讨论的串流平台支援杜比全景声听起来又是如何呢?在家也能制作Dolby Atmos 的混音吗?这篇文章带你从声道基准出发,初步解说Dolby Atmos 的原理与混音须知,一窥近期讨论度相当高的Dolby Atmos Music。
Part 1 - 关于多声道
双声道/立体声技术自1957 年问世并在60 年代大量投入商用音讯市场后,渐渐取代了没有方向性的单声道规格,至今已经在唱片产业纵横超过60 年,时至今日仍然是一般用户聆听音乐时最常使用的声音规格。
然而人耳精密的听觉系统经过年岁的经历,除了能够迅速判断发出声音的物件为何,更能够准确的辨识声音来源的方向性。 Stereo 虽然被称为立体声,但事实上想要获得更加全面且近似于真实物件发出的的立体声音,至少需要三个声道以上才能够呈现较为准确的声场。
因此有了多声道的发展,亦即以增加喇叭或是发声源的数量来增加声音定位的准确性,让聆听者可以清楚感受到发声体的确切位置,得到身历其境的听觉感受。常见的多声道规格有像是5.1、7.1、9.1、Dolby Atmos 和DTS:X 等等,其多应用于电影、电玩产业、家庭剧院、演唱会、表演艺术等画面与声音结合的视听场景。
5.1 声道基本配置图(LFE 未显示) [1]
7.1 声道基本配置[2]
支援Dolby Atmos 全景声系统的桃园新光影城 [3]
Part 2 - 什么是Dolby Atmos
Dolby Atmos 是一种环绕的声音体验规格,让聆听者感受到真正接近立体的声音能量,身历其境般的置身于创作者精心打造的故事场景。其原理使用最多达64 组独立播放喇叭,能够最多同时传送128 个声道。 128 个音讯声道主要由两部分组成,第一部分为一般较常见的7.1.2 声道系统(前方的L/C/R, LFE, 以及四个周边环绕的喇叭,搭配两个至于头顶的声道),通常被称为Audio Beds ,第二部分为多达118 个”物件导向” (Object Based) 的Objects,这些被称为Object 的物件可以让你自由配置在3D 空间内,Panning 的范围跟方式跳脱了以往双声道的疆界,非常适合用来设计需要被摆放在特定位置的声音或是某些在三维空间内移动的音色。
Channel Based vs Object Based [4]
传统5.1 声道与Dolby Atmos 对于物件声音移动的表现[5]
Part 3 - Dolby Atmos Music
多年来音乐市场上主要还是以双声道的混音为主,主要原因为:受限于聆听用户的硬体规范,所以市场上鲜少推出多声道的音乐作品。这样的情况一直到Dolby Atmos Music 问世后出现改变。
Dolby Atmos 支援在高阶电玩主机上已有一段时间,近年讨论度频繁的用串流收听空间音讯,例如:APPLE MUSIC 即是在此基础下,让用户在使用部分APPLE 的产品收听音乐时可以感受到整体音乐的定位是3D 环绕的,声音的来源可能来自前后左右或是上方。
支援Dolby Atmos 规格播放的Apple Music [6]
一般来说,公开发行的电影若需要Dolby Atmos 规格的音效/配乐,就必须要在Dolby 公司专业认证的录音室完成其混音与母带制作。但若是发行Dolby Atmos 规格的音乐,目前尚未有必须在Dolby 认证录音室制作的规范。
今天就带大家来认识若需要将自己的音乐混音成Dolby Atmos Music 的话需要做哪些准备。
Chris Lord-Alge 的Dolby Atmos 规格工作室[7]
Part 4 - 使用软件制作Dolby Atmos 混音
只有发行电影的需求才需要至杜比认证工作室使用相关规格的硬体Renderer 和母带后期工具。若非发行电影的需求你可以使用Apple Logic Pro, Avid Pro Tools, PreSonus Studio One, Steinberg Nuendo, Ableton Live 等DAW 搭配多I/O 的监听控制介面(输出最少要达12) 做Dolby Atmos 混音,最低设备要求若是一台笔电搭配一副耳机也是能够做出Dolby Atmos 音乐的,这也是今天要带大家认识的主要部分。
使用Logic Pro 做Dolby Atmos 混音[8]
以上软件除了Ableton Live 外都有内建原生的Renderer,Ableton Live 的用户需要购买/安装Dolby Atmos Renderer,以及安装Dolby Atmos Music Panner 来混音。
Dolby Atmos Music Panner Plugin [9]
Part 5 - Dolby Atmos 混音的核心工具Renderer 是什么
制作Dolby Atmos 混音需要有具Dolby 官方认证规范的Renderer 软件,Renderer 是Dolby Atmos 系统的核心,这个元件也可能内建于能够制作Dolby Atmos 混音的任何DAW (如上述所提到的软件),其也装载于能够支援Dolby Atmos 混音的各项消费级设备中。作为一个音讯处理器,将Object Based 的输入讯号转换为基于声道导向的输出,以便使我们能够在喇叭或是耳机上聆听,我们在DAW 里针对各物件的位置摆放会合理的呈现在播放环境中,Renderer 也能够将Dolby 混音编码成能够发行到串流媒体及蓝光光碟的档案格式。
Renderer 能够将Object Based 的输入讯号转换为基于声道导向的输出[10]
Dolby 官方在2023 年所推出的Dolby Atmos Renderer application 是款结合过去Dolby Atmos Production Suite 和Dolby Atmos Mastering Suite 两款方案的最新软件。其可以在单/双主机上使用,撇除了过去使用Dolby Atmos Production Suite 时DAW 与Renderer 在同台电脑并行时效能过载的问题,而其也拥有Dolby Atmos Mastering Suite 全系列的混音功能,并且原生支援配备Apple 晶片的电脑。
Dolby Atmos Renderer 可以在Avid 官方网站购买,价格是$299 美元。若是过去拥有Production Suite / Masering Suite 的用户升级成此版本价格为$50 美元。你也可以在Doby 官网下载90 天的免费试用版来好好认识这个全景声的混音工具。
Dolby Atmos Renderer [11]
*Dolby Audio Bridge 是将音讯自DAW 导向单一电脑上的Dolby Atmos Renderer 所必需的工具,其会附在购买的Dolby Atmos Renderer 里,但此工具仅支援macOS。在Windows 上使用Dolby Atmos Renderer 则必须将其使用在与DAW 分开的另一台电脑上,并使用硬体方式来将音讯输入/输出至DAW。
Part 6 - 挑选DAW 做Dolby Atmos 混音的依据
多声道混音的功能在DAW 上已渐渐成为显学,而能够做Dolby Atmos 混音的软件也不算少数,重点在于要选择哪款软件当作自己的混音工具,而就。这边建议大家先了解自己手边的DAW 是否有内建Renderer 可以使用,且所需要混音的专案复杂程度以及混音的Workflow 才能决定是否要购买官方的Dolby Atmos Renderer。例如使用内建Renderer 的DAW 具有像是节省软硬体添购的成本、操作流程统一、无需另外配置物件\声道的Routing、无需额外设置LTC 同步、学习曲线低等优势,可以更专注在创作面的发想。 Pro Tools 在2023 年也推出了专属的内建Renderer,但在此前居多Dolby Atmos 混音工作者都是使用Pro Tools 与Dolby Atmos Suite 分开电脑做搭配,因为其具有许多集成且功能完整的工具可以增强独立使用Renderer 的工作流程。
Studio One 的Dolby Atmos Mixing 认证软件[12]
使用DAW 而非独立运作的Renderer 可能的限制包含其只能使用一个音床(Bed) 、相对受限的喇叭输出配置、至多只能输出到7.1.4 (或9.1.6) 的声道也无法与Dolby Atmos Renderer 11.1.10 相比拟、仅支援ADM BWF 的输入与输出、无法校准喇叭、缺乏Spatial Coding 模拟,以及单台电脑混音时效能过载等问题。
以上大致提出使用独立运作Renderer 与DAW 内建Renderer 的差异性,而真实情况及详细配套都还是取决于个人的需求及工作流程。
Pro Tools 可以说是目前与Dolby Atmos 配套最为完整的DAW [13]
Part 7 - 使用电脑制作Dolby Atmos 混音的基本须知与相关流程
确定DAW Session 与Renderer 使用相同的取样率。取样率会影响可以使用的Bed 和Objects 数量。在48kHz 工作时,Renderer 支援128 个Input Channel (10 Beds \118 Objects/Beds),而在96kHz 时,有64 个输入声道可用(10 Beds \ 54 Objects / Beds)
Pro Tools Buffer Size Setting [14]
若在单台电脑上使用Standalone 版本的Renderer 需设置Input 为Dolby Audio Bridge。
*这个情况只会发生在Mac 的使用者,因为Dolby Atmos Randerer 无法在Windows 版本单机作业。
若取样率为48k,I/O 的Buffer Size 设定为1024 samples,96k 则设定为2048。
Logic Pro 的相关设定页面[15]
设定Audio Bed 的格式。以Dolby Atmos Renderer 为例,格式可以是2.0, 3.0, 5.0, 5.1, 7.0, 7.1, 7.0.2 或7.1.2.
设定Output 的声道格式,这边完全取决于你使用的硬体喇叭配置,可能是5.1、 7.1.2 或9.1.6 等,当然也可以设定为使用耳机当作Output,若使用耳机当作监听的话记得转换模式为Binaural Mode,才能真正感受近似于Atmos 混音的成效而不是双声道的听感。
Binaural Render Mode 是Renderer 的一个功能,允许您通过元数据对混音中的每个Object 或Bed 应用距离模型。这仅适用于耳机混音,将其编码为Dolby AC-4 沉浸式立体声以供耳机监听。
适用于耳机混音的Binaural 耳机输出,图为Studio One 的设置[16]
设置DAW 的声道与其相对应的Object,这部分需要看您使用的软件是哪款,像Logic 会自动产生对应的组合,而Pro Tools 则是需要透过 Dolby Atmos Music Panner 来做设置。
关于音量的规范, Dolby 官方网站的指南中建议混音成品的整体音量以不超过18 LKFS 为主。而True Peak 则以-1 或更小为基准。
Part 8 - Dolby Atmos 的输出规范
Dolby Atmos 的输出规格主要有3 种:DAMF、ADM BWF 以及IAB/IMF。
DAMF (Dolby Atmos Master File)
杜比全景声主文件,是一种用于储存和管理杜比全景声(Dolby Atmos) 资料的文件格式。在制作电影、影剧或其他多媒体作品时,Dolby Atmos 是一种广泛使用的格式,通常DAMF 为Dolby 认证的录音室之主要输出格式。
文件包含了由RMU (Rendering Master Unit) 生成的系列文件,其中包括了描述音讯资料和元数据的不同部分。主要组成部分包括:
.atmos:XML 格式,描述了其他两个文件的名称以及相关的元数据,如Audio Bed 和Objects 的使用情况、起始时间、帧率等资讯。
.atmos.metadata:XML格式,其包含物件随时间变化的XYZ 坐标和大小等元数据。由于涉及大量的物件动态效果,文件容量较大。
.atmos.audio:这是一个Core Audio File(CAF)格式的音讯文件,其中包含了多达128 轨的声音资料。这会是文件最大的部分。
DAMF 文件的主要作用是将所有的音讯资料和相关元数据集中储存到一个文件中,以便于在后期制作过程中对音频进行处理和管理。这些文件可以被用于从事后期制作工具(如Pro Tools) 中重新创建混音专案,以及将沉浸式音讯资料转换为其他格式。
ADM BWF (Audio Definition Model Broadcast Wave Format)
这是一个广播WAV (Broadcast WAV) 的变体,专门用于沉浸式音讯的后期制作流程。
ADM BWF 是Dolby 认证的标准档案,其也是大多能做Dolby Atmos 混音的DAW 所输出的主要规格,更是将Dolby Atmos 音乐上传至串流平台的主要格式。 ADM BWF 文件的优点之一是它的兼容性和可互操作性,能够被导入大部分能够制作Dolby 全景声混音的DAW 中,以重新开启所有音讯和声道元数据。其也能由DAMF 自Dolby Atmos 的转换工具转换而来。
Dolby Atmos 常见档案格式ADM BWF 内涵整体混音的内容[17]
IAB/IMF (Immersive Audio Bitstream for IMF)
是一种将沉浸式声音资料集成到IMF (Interoperable Master Format,互操作性主格式) 的标准化方法。 IMF是一种用于制作、交换和储存影音内容的档案格式,它提供标准化的框架,以便不同的后期制作工具间可以相互操作,从而提高了工作流程的效率和互通性。
Part 9 - Dolby Atmos 混音的基础建议指南
人类的双耳已经进化成几乎能够感知空间中所有方向的声音,我们的耳朵和大脑如何协同工作来确定声音的位置是整个演化过程的产物。我们整理了Dolby 官方针对Dolby Atmos 混音时给出的一些经验分享与操作建议,大家在刚开始碰到如此繁复的混音工作难免会发生不知该从何下手的状况,这时可以参考看看以下这些简单的混音建议帮助自己理出一些头绪。
哪些声音适合作为Bed 部分?哪些适合Object 部分?基本原则是,如果听起来合适,那么就是合适的。但这边也分享网路其他混音师相关说法,若有些特定的声音你希望他处于一个符合标准传统多声道位置的话,建议把他放在Bed,或是某些音色你希望是持续性的处在某个位置也建议放在Bed;其他介于这些非特定声道之间的音色,可以摆放在Object。当然这些都是较笼统的概念,还是要靠自己的耳朵,搭配经验与创意做出最合适的判断。
使用Mono 音轨,而不是立体声音轨,可以更好的控制Object 的位置。
将效果与干净的声音分开输出可以让你将干净的声源放在与效果不同的位置,同时也可以为干净的声源和效果应用不同的双声道渲染模式设置。这在处理人声时尤其有效。
如果只有立体声音轨或包含效果的音轨能用,可考虑M/S 分离做处置。
我们会将更高频率的声音视为更有可能来自于我们上方而不是下方。
同理,拥有更多低频率内容的声音更有可能被认为来自较低的位置。低频声音也比具有更高频率内容的声音更不具方向性。
如果声音具有明显的4k 到8 kHz 的频率,我们更有可能感受到其高度的变化。
使用Dolby Atmos,不仅可以考虑左右平衡,还可以考虑前后平衡。将声音放在听众后面,以补充或对比正在前方发生的事情,可以突显Dolby Atmos 所实现的3D 音场
间歇性声音可以提供重要的空间提示作用(例如,前方放置一个主唱,后方放置回应的合唱)
从听众头部的偏离位置放置的声音将提供更多的空间讯息。试着将Object 放置在听众头部的左侧或右侧,然后从前到后、从高到低移动它们。
位于伦敦 RAK Studio 里能够制作Dolby Atmos 混音的Studio 4 [18]