一种主备双路音视频流的帧偏移量人工智能预测方法

正文

推荐专利

申请号：CN202511042112

申请日期：2025-07-28

公开号：CN120894728A

公开日期：2025-11-04

类型：发明专利

摘要

本发明提供一种主备双路音视频流的帧偏移量人工智能预测方法，涉及视频处理技术领域。所述方法包括：对第一视频流和第二视频流进行预处理，获得第一视频帧序列和第二视频帧序列；对第一视频帧序列和第二视频帧序列分别进行特征提取处理，获得第一时空特征图和第二时空特征图；获取第一分区特征向量和第二分区特征向量，并输入时序关系模型，获得时序关系特征信息，并输入多层感知网络模型，获得帧偏移量。根据本发明，可通过对两个视频流进行相同的预处理，降低编码方式不同造成的影响，并且，可通过对视频帧的内容和时序关系进行理解的方式确定帧偏移量，进一步降低视频编码方式不同造成的视频帧差别的影响，提升对齐准确性。

技术关键词

视频帧多层感知网络视频流人工智能预测方法时序序列卷积神经网络模型交叉注意力机制层级关系人工智能预测系统计算机程序指令矩阵音视频视频编码方式融合特征键值特征提取模块分区模块

系统为您推荐了相关专利信息

一种低温环境下的锂离子电池预热方法及系统

回归预测模型等效电路模型仿真数据预热方法多项式

一种基于Re-RSSI的时序InSAR电离层误差鲁棒校正方法

电离层误差合成孔径雷达影像校正方法时序加权最小二乘算法

基于机器学习构建肺部感染风险预测模型的方法及系统

风险预测模型多模态特征融合焦点损失函数时序特征数据

一种缺失值填充方法、装置、电子设备及存储介质

缺失值填充方法风电机组设备对象元素电子设备

一种肢体冲突行为的识别方法、装置及存储介质

动态视觉传感器姿态特征情绪特征深度相机时序特征

一种主备双路音视频流的帧偏移量人工智能预测方法

站点导航

APP 下载