Page 19 - BP

Page 19 - BP_202102

P. 19

成进直播信号中。和演播室嘉宾的讲话打字幕，对新闻操作是非常有
“SMARTLIVE在使用的预算和人员不变的情益的。”
况下，使制作团队能够制作更多内容，从而增加体
育迷参与度和收入，”Tedial产品副总裁杰罗姆· 压缩
沃弗茨说，“SMARTLIVE还可以直接连接到现有视频压缩始终是在数据率降低和视频质量之间
的制作环境，这样我们的客户就可以使用他们现有求平衡。通过如其VOS360直播流媒体平台这样的
的基础设施摄取、编辑和分发内容；不需要额外的基于AI和ML的云解决方案，哈雷的目标是更有效
投资。” 地实现这一平衡。
“我们的PURE压缩引擎使用AI/ML改进管
字幕和翻译理视频压缩的算法，”哈雷公司负责AI/ML用于
AI/ML吸引力正在增加的另一个劳动力密集型视频压缩的高级产品营销经理让-路易·迪亚斯科恩
领域是多语种字幕。使用语音转文字AI系统，可以说，“与使用人类工程师相比，使用AI/ML技术
从内容的音频中自动生成文字字幕，并在同一数据实现这些改进要快得多。在去年的NAB BEITC上
流内以多种语言提供它们。提出后我们不断取得进展，现在的目标是解决密度
“这些算法经过训练，能够实时从数据中学方面的问题。”
习，吸收当地措辞和方言，从而获得最佳字幕体
验，”IBM Watson Media高级销售经理布兰登· 推荐引擎
沙利文表示，“随着AI和机器学习训练能力的提亚马逊、Netflix和YouTube等流媒体服务使
高，当地方言、地名和特定的名字，以及个别发言用AI/ML赋能的推荐引擎挖掘观众当前的内容选
者的话音，都将被准确捕捉。未来，这不仅会改变择，并利用他们的发现推荐可能感兴趣的类似节
隐含字幕，还会改变自动翻译、视频检索等。” 目。视频发现技术提供商Vionlabs的AI/ML内容
字幕和口型同步是Interra Systems的视频质发现平台旨在帮助广播公司评估自己的内容库，聚
量控制平台DATON的两个AI/ML技术。“通过AI/ 焦并提升它们的直接面向消费者的线上销售。
ML，你可以提高字幕的准确性和速度，这是一个 “高质量数据可以帮助广播公司更了解他
资源密集型、耗时的处理，”Interra Systems产们的内容，并在整个内容周期中做出更精明的决
品管理副总裁阿努帕玛·安纳塔拉曼说，“它在检定，”Vionlabs首席执行官马库斯·伯格斯特伦说，
测‘口型同步’方面也特别有效：屏幕上嘴唇运动 “其中一个例子就是内容推荐，让广播公司对成功的
和说话内容一致。” 节目如何吸引观众有更深刻的理解。它还可以帮助他
Telestream云产品经理雷米·福尔罗表示，们自动符合儿童不宜电视时限后开播的规定。”
Telestream Cloud包括如同其许多基于云的AI/ 该公司2020年2月推出了“情绪指纹API”，
ML支持服务的字幕；其它服务是为多个分发平台帮助媒体公司根据AI生成的视频数据和洞察力做出
进行视频转码和质量/合规检查。更好的决策。据该公司介绍，情绪指纹API使用计
“我们利用许多基于云的提供商的语音文本转算机视觉和机器学习生成情绪数据，基于Vionlabs
换功能，生成多种语言的准确字幕，”福尔罗说，的推荐，打造一种独特的个人观看体验。
“这是AI/ML在准确、高效地完成任务方面真正闪情绪指纹API是为测量视频播放期间的数千个
耀的领域。” 因素（颜色、速度、音频和对象识别等）以便逐帧
ENCO的enCaption4平台为直播和录播电视生成呈现内容情绪结构的AI导出的指纹而设计的。
内容提供自动化隐含字幕，并将AI驱动的机器学习
与神经网络语音文本转换引擎相结合。除了通过AI 有限制
教给独特词语的新闻演播室节目流程单导入外， AI/ML赋能系统现在在电视制作/播出流中扮
enCaption4还可以教给专门的词语，如主持人和演许多角色。但他们并非无所不能；至少现在还
演员姓名，以及当地说法。其它AI驱动的增强改进不能。
了字幕标点符号和大小写。 “为了让机器学习工具有效地工作，你需要
“enCaption可以准确地拼写从摄入清单和脚不断地对模型进行微调，并需要大量准备充分的数
本中学习到的罕见词汇，而且不需要为每个说话者据，”安纳塔拉曼说，“将会出现需要人工干预的
创建语音模式个人档案，”ENCO总裁肯恩·弗罗具有挑战性的情况。然而，对于大多数内容，AI/
姆特说，“自动为来自各个主播、记者、气象学家 ML可以提供极高的准确性。” B&P

14 15 16 17 18 19 20 21 22 23 24