Page 19 - BP_202102
P. 19

成进直播信号中。                                     和演播室嘉宾的讲话打字幕,对新闻操作是非常有
               “SMARTLIVE在使用的预算和人员不变的情                  益的。”
           况下,使制作团队能够制作更多内容,从而增加体
           育迷参与度和收入,”Tedial产品副总裁杰罗姆·                    压缩
           沃弗茨说,“SMARTLIVE还可以直接连接到现有                       视频压缩始终是在数据率降低和视频质量之间
           的制作环境,这样我们的客户就可以使用他们现有                       求平衡。通过如其VOS360直播流媒体平台这样的
           的基础设施摄取、编辑和分发内容;不需要额外的                       基于AI和ML的云解决方案,哈雷的目标是更有效
           投资。”                                         地实现这一平衡。
                                                           “我们的PURE压缩引擎使用AI/ML改进管
           字幕和翻译                                        理视频压缩的算法,”哈雷公司负责AI/ML用于
               AI/ML吸引力正在增加的另一个劳动力密集型                   视频压缩的高级产品营销经理让-路易·迪亚斯科恩
           领域是多语种字幕。使用语音转文字AI系统,可以                      说,“与使用人类工程师相比,使用AI/ML技术
           从内容的音频中自动生成文字字幕,并在同一数据                       实现这些改进要快得多。在去年的NAB BEITC上
           流内以多种语言提供它们。                                 提出后我们不断取得进展,现在的目标是解决密度
               “这些算法经过训练,能够实时从数据中学                      方面的问题。”
           习,吸收当地措辞和方言,从而获得最佳字幕体
           验,”IBM Watson Media高级销售经理布兰登·                推荐引擎
           沙利文表示,“随着AI和机器学习训练能力的提                          亚马逊、Netflix和YouTube等流媒体服务使
           高,当地方言、地名和特定的名字,以及个别发言                       用AI/ML赋能的推荐引擎挖掘观众当前的内容选
           者的话音,都将被准确捕捉。未来,这不仅会改变                       择,并利用他们的发现推荐可能感兴趣的类似节
           隐含字幕,还会改变自动翻译、视频检索等。”                        目。视频发现技术提供商Vionlabs的AI/ML内容
               字幕和口型同步是Interra Systems的视频质              发现平台旨在帮助广播公司评估自己的内容库,聚
           量控制平台DATON的两个AI/ML技术。“通过AI/                  焦并提升它们的直接面向消费者的线上销售。
           ML,你可以提高字幕的准确性和速度,这是一个                          “高质量数据可以帮助广播公司更了解他
           资源密集型、耗时的处理,”Interra Systems产                们的内容,并在整个内容周期中做出更精明的决
           品管理副总裁阿努帕玛·安纳塔拉曼说,“它在检                       定,”Vionlabs首席执行官马库斯·伯格斯特伦说,
           测‘口型同步’方面也特别有效:屏幕上嘴唇运动                       “其中一个例子就是内容推荐,让广播公司对成功的
           和说话内容一致。”                                    节目如何吸引观众有更深刻的理解。它还可以帮助他
               Telestream云产品经理雷米·福尔罗表示,                 们自动符合儿童不宜电视时限后开播的规定。”
           Telestream Cloud包括如同其许多基于云的AI/                  该公司2020年2月推出了“情绪指纹API”,
           ML支持服务的字幕;其它服务是为多个分发平台                       帮助媒体公司根据AI生成的视频数据和洞察力做出
           进行视频转码和质量/合规检查。                              更好的决策。据该公司介绍,情绪指纹API使用计
               “我们利用许多基于云的提供商的语音文本转                     算机视觉和机器学习生成情绪数据,基于Vionlabs
           换功能,生成多种语言的准确字幕,”福尔罗说,                       的推荐,打造一种独特的个人观看体验。
           “这是AI/ML在准确、高效地完成任务方面真正闪                        情绪指纹API是为测量视频播放期间的数千个
           耀的领域。”                                       因素(颜色、速度、音频和对象识别等)以便逐帧
               ENCO的enCaption4平台为直播和录播电视                生成呈现内容情绪结构的AI导出的指纹而设计的。
           内容提供自动化隐含字幕,并将AI驱动的机器学习
           与神经网络语音文本转换引擎相结合。除了通过AI                      有限制
           教给独特词语的新闻演播室节目流程单导入外,                           AI/ML赋能系统现在在电视制作/播出流中扮
           enCaption4还可以教给专门的词语,如主持人和                   演许多角色。但他们并非无所不能;至少现在还
           演员姓名,以及当地说法。其它AI驱动的增强改进                      不能。
           了字幕标点符号和大小写。                                    “为了让机器学习工具有效地工作,你需要
               “enCaption可以准确地拼写从摄入清单和脚                 不断地对模型进行微调,并需要大量准备充分的数
           本中学习到的罕见词汇,而且不需要为每个说话者                       据,”安纳塔拉曼说,“将会出现需要人工干预的
           创建语音模式个人档案,”ENCO总裁肯恩·弗罗                      具有挑战性的情况。然而,对于大多数内容,AI/
           姆特说,“自动为来自各个主播、记者、气象学家                       ML可以提供极高的准确性。” B&P



                                                                                                              19
   14   15   16   17   18   19   20   21   22   23   24