摘要
本公开提供了视频处理方法、装置及电子设备,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于数字人、基于人工智能的内容生成等场景。具体实现方案为:确定待处理视频的视频片段序列,以及视频片段序列中视频片段对应的文本内容和至少一个动作标签信息;根据文本内容以及至少一个动作标签信息,从视频片段中提取关键视频子片段;对关键视频子片段进行视频理解处理,得到关键视频子片段的子片段摘要内容;其中,视频片段序列的确定,使得视频处理方法可以适用于持续时间较长的视频等;至少一个动作标签信息的考虑,使得视频处理方法可以理解视频中的突发性事件等,从而提高视频处理效率。
技术关键词
视频帧
轨迹特征
多模态
标签
文本
人体关键点检测
人体姿态检测
序列
摘要
大语言模型
动作强化
手部关键点
电子设备
处理器
人工智能技术
计算机程序产品
计算机视觉
系统为您推荐了相关专利信息
植被
数据生成方法
气候
图像分析模型
数据分析模型
情感识别方法
情感分类器
双向长短期记忆网络
多模态对话
情感状态建模