Page 18 - BP_202208
P. 18

本期关注
                      Focus






                   使下一代音频个性化






                   凯文·希尔顿


                      所有新的广播技术都会带来好处,                道加上对象)的时候,你甚至可以向                  我们听不见你说话
                   但焦点往往是在那些在娱乐或冲击力方                 它添加一些个性化。”                            由于各种原因,现在各个年龄段
                   面增强观看或聆听体验的技术。更实                     正是在这种扩展的组合模式下,富                的人越来越多地出现听力问题。在过去
                   用和辅助的功能,如隐含字幕和音频描                 克斯看到了MPEG-H音频在未来提供                的十年里,广播公司已经看到越来越多
                   述,在很大程度上被认为是必要但却是                 的优势和机会。“如果你只是把重点放                 的人抱怨节目难以理解。2020年底,
                   为特定的受众设计的。这种态度正在转                 在沉浸式和声道混合,基本上它只是一                 弗劳恩霍夫集成电路研究所与德国地区
                   变,正如下一代音频(NGA)所示的                 小部分编解码功能,”他说,“但我认                 公共广播公司WDR联合发布了一项调
                   那样,它的推广更多地是基于个性化能                 为这是迈向未来的重要一步,因为在声                 查,发现所有人口群体中68%的观众经
                   力,而不是沉浸式声音。                       音制作方面,人们首先必须学会使用新                 常或非常频繁地在理解电视上言语方面
                      NGA系统建立在基于对象的音频                方法,同时还能产生一些不错的混音。                 存在问题。正因为如此,现在很多人如
                   (OBA)概念基础之上,它具有传统                 下一步,他们可以超越这一点,设法获                 果听不清对白就会打开字幕。
                   音频声道(5.1或7.1)的基础,但有多              得个性化的沉浸式体验。”                          包括BBC在内的一些OBA开发者
                   达128个“对象”。这些单独的音频元                                                  已经在研究一种技术,使观众或听众能
                   素可以要么位于音景的不同部分,以营                 测试MPEG-H音频                        够改变语音与背景声效和/或音乐之间
                   造沉浸式体验,要么用来代表一个信号                    这些组合出现于弗劳恩霍夫在疫情                的平衡。MPEG-H音频中这一系统是
                   的特定成分,如语音/评论和背景声。                 前两年进行的MPEG-H音频测试中。                Dialog+,它是一种使响度级可以适应
                   它们的确切位置或功能由伴随的元数据                 该系统2018年和2019年的两次欧洲歌              于语音和背景声的制作技术。为了做到
                   定义。                               唱大赛上进行了测试,不但为大赛提供                 这一点,Dialog+利用了深度学习,它
                      两种主要的N G A格式——                 了沉浸式音频,而且还提供了更实用的                 只有在最终混音完成后才能使用。通过
                   M P E G -H音频和杜比A C-4,都利           附加功能。富克斯表示,挑战在于这样                 这种方式,可以创建满足特定个人要求
                   用 O B A 获得 沉浸 式 音频 ( 分别 为         的制作如何与音乐/特效、5.4制作中的               的自定义语音级。
                   MPEG-H 3D音频和杜比全景声)以及              国际声、以及作为提供个性化的独立对                     富克斯说,在M P E G-H制作的
                   个性化和无障碍功能。最后两个功能可                 象(如对白增强或评论选择和语言)的                 各个方面,元数据都非常重要。“它
                   以用来在足球赛转播时选择某一位解说                 对白和评论一起工作。                        需要与音频信号紧密同步,”他说,
                   员或某一语言(个性化);让听力不好                    “我们对一些体育赛事也采取了                 “首先,在现有的SDI基础设施中,我
                   人士能够改变电视剧配乐上台词和声效                 这种做法,例如在法国网球公开赛上与                 们希望能够使用其中一个音轨将元数
                   /音乐之间的平衡(无障碍性)                    法国电视台合作,”他表示,“那是在                 据传递给编码器。我们有几种携带元
                      虽然沉浸式音频的运动和全包围效                2019年,在整个比赛期间,在巴黎作                数据的调制信号,而从编码的角度来
                   果对故事片有明显吸引力,但有一种观                 为一个DVB-2 UHD服务播出,他们有              看是相同的输入接口。编码器只读取
                   点,尤其是在NGA的开发者中,个性化                标准的立体声,然后是有两个评论声和                 元数据并进行相应的操作。这有点像
                   和无障碍性才是OBA的真正意义。                  5.4的MPEG-H第二音轨。这是一个完              制作过程中的远程控制,所以编码并
                      “对我们来说,个性化和沉浸式                 整的、半自动化的现场制作,他们可以                 不比过去更复杂。在输出端,对于播
                   的结合才是最有价值的,”MPEG-H                在没有直播时切换到录播。”                     出,它是一个单比特流。这意味着事
                   音频的主要开发者、弗劳恩霍夫集成                     MPEG-H音频的个性化方面包括               实上播出系统并不需要改变。它是一
                   电路研究所媒体系统和应用主管哈罗                  选择体育比赛某一评论的能力(可能不                 个承载任何制作内容的MPEG-H基本
                   德·富克斯表示,“你可以从事件中拾                 仅是在电视或广播评论员之间选择,而                 流,沉浸于对象中。”
                   取声音并创造一个5.1.4或7.1.4混音,            且是在体育迷评论之间选择),以及选                     MPEG-H音频已在巴西实施,但
                   这是音频捕获的对象方面。下一步是                  择人群声来自场地哪一端(主队端或客                 尚未被欧洲广播公司采用。虽然总是有
                   将这些对象与一些元数据分开;你在                  队端)的可能性。虽然这让观众在看什                 可供选择的更高调的杜比格式,但随着
                   混音中考虑了它们,但实际上你并没                  么和怎么看方面有更多的选择和灵活                  对广播市场内非沉浸式特性可提供东西
                   有把它们混合到5.4中。下一步,将是                性,但在辅助聆听方面,OBA还有其它                的了解增加,MPEG-H中的个性化和
                   你拥有沉浸式音频(不过为沉浸式声                  好处。                               辅助功能潜力可使之被接受。 B&P

                  18
   13   14   15   16   17   18   19   20   21   22   23