Page 19 - BP_202102
P. 19
成进直播信号中。 和演播室嘉宾的讲话打字幕,对新闻操作是非常有
“SMARTLIVE在使用的预算和人员不变的情 益的。”
况下,使制作团队能够制作更多内容,从而增加体
育迷参与度和收入,”Tedial产品副总裁杰罗姆· 压缩
沃弗茨说,“SMARTLIVE还可以直接连接到现有 视频压缩始终是在数据率降低和视频质量之间
的制作环境,这样我们的客户就可以使用他们现有 求平衡。通过如其VOS360直播流媒体平台这样的
的基础设施摄取、编辑和分发内容;不需要额外的 基于AI和ML的云解决方案,哈雷的目标是更有效
投资。” 地实现这一平衡。
“我们的PURE压缩引擎使用AI/ML改进管
字幕和翻译 理视频压缩的算法,”哈雷公司负责AI/ML用于
AI/ML吸引力正在增加的另一个劳动力密集型 视频压缩的高级产品营销经理让-路易·迪亚斯科恩
领域是多语种字幕。使用语音转文字AI系统,可以 说,“与使用人类工程师相比,使用AI/ML技术
从内容的音频中自动生成文字字幕,并在同一数据 实现这些改进要快得多。在去年的NAB BEITC上
流内以多种语言提供它们。 提出后我们不断取得进展,现在的目标是解决密度
“这些算法经过训练,能够实时从数据中学 方面的问题。”
习,吸收当地措辞和方言,从而获得最佳字幕体
验,”IBM Watson Media高级销售经理布兰登· 推荐引擎
沙利文表示,“随着AI和机器学习训练能力的提 亚马逊、Netflix和YouTube等流媒体服务使
高,当地方言、地名和特定的名字,以及个别发言 用AI/ML赋能的推荐引擎挖掘观众当前的内容选
者的话音,都将被准确捕捉。未来,这不仅会改变 择,并利用他们的发现推荐可能感兴趣的类似节
隐含字幕,还会改变自动翻译、视频检索等。” 目。视频发现技术提供商Vionlabs的AI/ML内容
字幕和口型同步是Interra Systems的视频质 发现平台旨在帮助广播公司评估自己的内容库,聚
量控制平台DATON的两个AI/ML技术。“通过AI/ 焦并提升它们的直接面向消费者的线上销售。
ML,你可以提高字幕的准确性和速度,这是一个 “高质量数据可以帮助广播公司更了解他
资源密集型、耗时的处理,”Interra Systems产 们的内容,并在整个内容周期中做出更精明的决
品管理副总裁阿努帕玛·安纳塔拉曼说,“它在检 定,”Vionlabs首席执行官马库斯·伯格斯特伦说,
测‘口型同步’方面也特别有效:屏幕上嘴唇运动 “其中一个例子就是内容推荐,让广播公司对成功的
和说话内容一致。” 节目如何吸引观众有更深刻的理解。它还可以帮助他
Telestream云产品经理雷米·福尔罗表示, 们自动符合儿童不宜电视时限后开播的规定。”
Telestream Cloud包括如同其许多基于云的AI/ 该公司2020年2月推出了“情绪指纹API”,
ML支持服务的字幕;其它服务是为多个分发平台 帮助媒体公司根据AI生成的视频数据和洞察力做出
进行视频转码和质量/合规检查。 更好的决策。据该公司介绍,情绪指纹API使用计
“我们利用许多基于云的提供商的语音文本转 算机视觉和机器学习生成情绪数据,基于Vionlabs
换功能,生成多种语言的准确字幕,”福尔罗说, 的推荐,打造一种独特的个人观看体验。
“这是AI/ML在准确、高效地完成任务方面真正闪 情绪指纹API是为测量视频播放期间的数千个
耀的领域。” 因素(颜色、速度、音频和对象识别等)以便逐帧
ENCO的enCaption4平台为直播和录播电视 生成呈现内容情绪结构的AI导出的指纹而设计的。
内容提供自动化隐含字幕,并将AI驱动的机器学习
与神经网络语音文本转换引擎相结合。除了通过AI 有限制
教给独特词语的新闻演播室节目流程单导入外, AI/ML赋能系统现在在电视制作/播出流中扮
enCaption4还可以教给专门的词语,如主持人和 演许多角色。但他们并非无所不能;至少现在还
演员姓名,以及当地说法。其它AI驱动的增强改进 不能。
了字幕标点符号和大小写。 “为了让机器学习工具有效地工作,你需要
“enCaption可以准确地拼写从摄入清单和脚 不断地对模型进行微调,并需要大量准备充分的数
本中学习到的罕见词汇,而且不需要为每个说话者 据,”安纳塔拉曼说,“将会出现需要人工干预的
创建语音模式个人档案,”ENCO总裁肯恩·弗罗 具有挑战性的情况。然而,对于大多数内容,AI/
姆特说,“自动为来自各个主播、记者、气象学家 ML可以提供极高的准确性。” B&P
19