摘要
本发明提供一种主备双路音视频流的帧偏移量人工智能预测方法,涉及视频处理技术领域。所述方法包括:对第一视频流和第二视频流进行预处理,获得第一视频帧序列和第二视频帧序列;对第一视频帧序列和第二视频帧序列分别进行特征提取处理,获得第一时空特征图和第二时空特征图;获取第一分区特征向量和第二分区特征向量,并输入时序关系模型,获得时序关系特征信息,并输入多层感知网络模型,获得帧偏移量。根据本发明,可通过对两个视频流进行相同的预处理,降低编码方式不同造成的影响,并且,可通过对视频帧的内容和时序关系进行理解的方式确定帧偏移量,进一步降低视频编码方式不同造成的视频帧差别的影响,提升对齐准确性。
技术关键词
视频帧
多层感知网络
视频流
人工智能预测方法
时序
序列
卷积神经网络模型
交叉注意力机制
层级
关系
人工智能预测系统
计算机程序指令
矩阵
音视频
视频编码方式
融合特征
键值
特征提取模块
分区模块
系统为您推荐了相关专利信息
回归预测模型
等效电路模型
仿真数据
预热方法
多项式
电离层误差
合成孔径雷达影像
校正方法
时序
加权最小二乘算法
风险预测模型
多模态特征融合
焦点损失函数
时序特征
数据
缺失值填充方法
风电机组设备
对象
元素
电子设备
动态视觉传感器
姿态特征
情绪特征
深度相机
时序特征