摘要
本发明提供一种发现音视频播出内容中异态的人工智能识别的方法,涉及视频处理技术领域,所述方法包括:将待处理视频进行解码,获得多个待处理视频帧,并进行特征提取处理,获得时空特征图;根据时空特征图,获得分区时空特征向量;将分区时空特征向量输入编码模型,获得综合时空特征信息;将综合时空特征信息输入分类判别模型,获得异态类型识别结果。根据本发明,可通过多个层级以及多个分区的特征提取处理,有效地捕捉视频中的局部信息和全局信息,有助于对视频内容进行准确理解,从而实现对视频的连续多帧的异态类型识别,并可适用于更多种场景和异态类型,提升识别准确性和适用性。
技术关键词
时空特征信息
层级
人工智能识别
视频帧
计算机程序指令
音视频
通道
多头注意力机制
输出特征
上采样
特征提取模块
分区模块
尺寸
解码模块
编码模块
系统为您推荐了相关专利信息
焊点缺陷检测方法
汽车门板
训练集
图片
多层级特征
主题色提取
输入设备
计算机视觉算法
输入模块
HDMI信号源