Page 18 - BP_202208
P. 18
本期关注
Focus
使下一代音频个性化
凯文·希尔顿
所有新的广播技术都会带来好处, 道加上对象)的时候,你甚至可以向 我们听不见你说话
但焦点往往是在那些在娱乐或冲击力方 它添加一些个性化。” 由于各种原因,现在各个年龄段
面增强观看或聆听体验的技术。更实 正是在这种扩展的组合模式下,富 的人越来越多地出现听力问题。在过去
用和辅助的功能,如隐含字幕和音频描 克斯看到了MPEG-H音频在未来提供 的十年里,广播公司已经看到越来越多
述,在很大程度上被认为是必要但却是 的优势和机会。“如果你只是把重点放 的人抱怨节目难以理解。2020年底,
为特定的受众设计的。这种态度正在转 在沉浸式和声道混合,基本上它只是一 弗劳恩霍夫集成电路研究所与德国地区
变,正如下一代音频(NGA)所示的 小部分编解码功能,”他说,“但我认 公共广播公司WDR联合发布了一项调
那样,它的推广更多地是基于个性化能 为这是迈向未来的重要一步,因为在声 查,发现所有人口群体中68%的观众经
力,而不是沉浸式声音。 音制作方面,人们首先必须学会使用新 常或非常频繁地在理解电视上言语方面
NGA系统建立在基于对象的音频 方法,同时还能产生一些不错的混音。 存在问题。正因为如此,现在很多人如
(OBA)概念基础之上,它具有传统 下一步,他们可以超越这一点,设法获 果听不清对白就会打开字幕。
音频声道(5.1或7.1)的基础,但有多 得个性化的沉浸式体验。” 包括BBC在内的一些OBA开发者
达128个“对象”。这些单独的音频元 已经在研究一种技术,使观众或听众能
素可以要么位于音景的不同部分,以营 测试MPEG-H音频 够改变语音与背景声效和/或音乐之间
造沉浸式体验,要么用来代表一个信号 这些组合出现于弗劳恩霍夫在疫情 的平衡。MPEG-H音频中这一系统是
的特定成分,如语音/评论和背景声。 前两年进行的MPEG-H音频测试中。 Dialog+,它是一种使响度级可以适应
它们的确切位置或功能由伴随的元数据 该系统2018年和2019年的两次欧洲歌 于语音和背景声的制作技术。为了做到
定义。 唱大赛上进行了测试,不但为大赛提供 这一点,Dialog+利用了深度学习,它
两种主要的N G A格式—— 了沉浸式音频,而且还提供了更实用的 只有在最终混音完成后才能使用。通过
M P E G -H音频和杜比A C-4,都利 附加功能。富克斯表示,挑战在于这样 这种方式,可以创建满足特定个人要求
用 O B A 获得 沉浸 式 音频 ( 分别 为 的制作如何与音乐/特效、5.4制作中的 的自定义语音级。
MPEG-H 3D音频和杜比全景声)以及 国际声、以及作为提供个性化的独立对 富克斯说,在M P E G-H制作的
个性化和无障碍功能。最后两个功能可 象(如对白增强或评论选择和语言)的 各个方面,元数据都非常重要。“它
以用来在足球赛转播时选择某一位解说 对白和评论一起工作。 需要与音频信号紧密同步,”他说,
员或某一语言(个性化);让听力不好 “我们对一些体育赛事也采取了 “首先,在现有的SDI基础设施中,我
人士能够改变电视剧配乐上台词和声效 这种做法,例如在法国网球公开赛上与 们希望能够使用其中一个音轨将元数
/音乐之间的平衡(无障碍性) 法国电视台合作,”他表示,“那是在 据传递给编码器。我们有几种携带元
虽然沉浸式音频的运动和全包围效 2019年,在整个比赛期间,在巴黎作 数据的调制信号,而从编码的角度来
果对故事片有明显吸引力,但有一种观 为一个DVB-2 UHD服务播出,他们有 看是相同的输入接口。编码器只读取
点,尤其是在NGA的开发者中,个性化 标准的立体声,然后是有两个评论声和 元数据并进行相应的操作。这有点像
和无障碍性才是OBA的真正意义。 5.4的MPEG-H第二音轨。这是一个完 制作过程中的远程控制,所以编码并
“对我们来说,个性化和沉浸式 整的、半自动化的现场制作,他们可以 不比过去更复杂。在输出端,对于播
的结合才是最有价值的,”MPEG-H 在没有直播时切换到录播。” 出,它是一个单比特流。这意味着事
音频的主要开发者、弗劳恩霍夫集成 MPEG-H音频的个性化方面包括 实上播出系统并不需要改变。它是一
电路研究所媒体系统和应用主管哈罗 选择体育比赛某一评论的能力(可能不 个承载任何制作内容的MPEG-H基本
德·富克斯表示,“你可以从事件中拾 仅是在电视或广播评论员之间选择,而 流,沉浸于对象中。”
取声音并创造一个5.1.4或7.1.4混音, 且是在体育迷评论之间选择),以及选 MPEG-H音频已在巴西实施,但
这是音频捕获的对象方面。下一步是 择人群声来自场地哪一端(主队端或客 尚未被欧洲广播公司采用。虽然总是有
将这些对象与一些元数据分开;你在 队端)的可能性。虽然这让观众在看什 可供选择的更高调的杜比格式,但随着
混音中考虑了它们,但实际上你并没 么和怎么看方面有更多的选择和灵活 对广播市场内非沉浸式特性可提供东西
有把它们混合到5.4中。下一步,将是 性,但在辅助聆听方面,OBA还有其它 的了解增加,MPEG-H中的个性化和
你拥有沉浸式音频(不过为沉浸式声 好处。 辅助功能潜力可使之被接受。 B&P
18