2024-10-31 12:05:00|冒泡网小编 |来源:投稿
近日,全球计算机视觉顶级会议欧洲计算机视觉大会(ECCV2024)在意大利米兰举行。在ECCV 2024的感知测试挑战赛中(Perception Test Challenge),来自腾讯视频AI技术中心的团队,在Temporal Action Localisation(时序动作定位,TAL)赛道荣获亚军。目前,腾讯视频已经将TAL技术应用于剧集宣发、视频版权保护等领域,催生出新的宣发内容生产模式和版权保护模式。此次在国际重要舞台上斩获佳绩,既是对腾讯视频在AI领域先进技术的认可,也是对其在前沿技术研发与应用上持续创新的肯定。
作为国际计算机视觉领域“三大顶会”之一,ECCV通过展示最新的研究成果、探讨未来趋势,并针对当前计算机视觉领域的挑战难题及热点问题组织全球挑战赛,激励着来自全球的科学和工业界精英不断突破创新边界,持续推动着全球计算机视觉领域的发展。为全面考察模型在记忆、抽象、物理和语义等多维度的理解能力,以及跨视觉、音频和文本模态的推理能力,Google DeepMind 团队在此次ECCV 2024 上举办了第2届感知测试挑战赛。
作为感知测试挑战赛的赛道之一,TAL技术能够在视频中准确地识别和定位特定的动作,在视频内容理解、AI素材生产、侵权内容识别等方面已经得到广泛应用。在AI素材生产方面,TAL技术通过对视频的智能分析,可以自动识别并定位影视剧或体育比赛中的关键动作,并剪辑生成短视频、精彩片段等视频素材。目前,腾讯视频已经将该技术应用于新剧宣发,极大提升了内容运营效率。例如在《庆余年2》等剧集的宣发中,AI技术可以精确捕捉剧中的关键情节、高能场景,进而制作出极具吸引力的高光片段、预告片等素材,还能够快速剪辑出话题包装、人物混剪、集锦混剪等多样化短视频,为宣传发行素材的生产方式带来革新。
TAL技术辅助《庆余年2》的宣发素材生产
在版权保护方面,TAL技术底层所用到的视频表征和指纹,还可用于识别搬运及侵权视频,实现对侵权内容的高效溯源,更好地保护创作者权益。通过高鲁棒性的视频指纹,可以快速从海量内容中检索出相似视频,得到精准的秒级匹配关系,并有效应对搬运者对视频的裁剪、缩放、色彩调节等编辑加工。借助视频指纹系统,腾讯视频已经在应用实践中实现对多部剧集的侵权行为识别及追偿,在保护创作者合法权益的同时,更维护了视频行业的健康生态和创新活力。
在本次 ECCV 2024 感知测试挑战赛中,腾讯视频AI技术中心从多模态基座网络、动作检测头和模型集成三个方面改进了传统的动作检测方案,让该算法不仅提高了模型的精度,还展现出了在处理复杂视频数据方面的泛化性。首先,采用了多模态特征提取基座网络来提取输入视频的视觉特征和音频特征,再利用ActionFormer和ActionMamba作为检测头输出动作定位的类别与时间边界,最后使用Weighted Box Fusion(WBF)将检测头的输出融合以获取更具泛化能力的结果。
腾讯视频AI技术中心长期致力于通过AI技术加强数字版权保护,支持高品质内容创作,在视频指纹和表征领域打下了坚实的技术基础,并积累了丰厚的技术经验。本次在国际舞台上的优异表现,是腾讯视频科技战略实践成果及技术创新能力的展示,也将进一步推动平台AI相关技术的创新突破,助力视频行业的高质量发展。
星标《腾讯视频Post》,不错过每一份精彩。
—READ MORE—
复制本文链接攻略文章为冒泡网所有,未经允许不得转载。