一种主备双路音视频流的帧偏移量人工智能预测方法

AITNT
正文
推荐专利
一种主备双路音视频流的帧偏移量人工智能预测方法
申请号:CN202511042112
申请日期:2025-07-28
公开号:CN120894728A
公开日期:2025-11-04
类型:发明专利
摘要
本发明提供一种主备双路音视频流的帧偏移量人工智能预测方法,涉及视频处理技术领域。所述方法包括:对第一视频流和第二视频流进行预处理,获得第一视频帧序列和第二视频帧序列;对第一视频帧序列和第二视频帧序列分别进行特征提取处理,获得第一时空特征图和第二时空特征图;获取第一分区特征向量和第二分区特征向量,并输入时序关系模型,获得时序关系特征信息,并输入多层感知网络模型,获得帧偏移量。根据本发明,可通过对两个视频流进行相同的预处理,降低编码方式不同造成的影响,并且,可通过对视频帧的内容和时序关系进行理解的方式确定帧偏移量,进一步降低视频编码方式不同造成的视频帧差别的影响,提升对齐准确性。
技术关键词
视频帧 多层感知网络 视频流 人工智能预测方法 时序 序列 卷积神经网络模型 交叉注意力机制 层级 关系 人工智能预测系统 计算机程序指令 矩阵 音视频 视频编码方式 融合特征 键值 特征提取模块 分区模块
系统为您推荐了相关专利信息
1
一种低温环境下的锂离子电池预热方法及系统
回归预测模型 等效电路模型 仿真数据 预热方法 多项式
2
一种基于Re-RSSI的时序InSAR电离层误差鲁棒校正方法
电离层误差 合成孔径雷达影像 校正方法 时序 加权最小二乘算法
3
基于机器学习构建肺部感染风险预测模型的方法及系统
风险预测模型 多模态特征融合 焦点损失函数 时序特征 数据
4
一种缺失值填充方法、装置、电子设备及存储介质
缺失值填充方法 风电机组设备 对象 元素 电子设备
5
一种肢体冲突行为的识别方法、装置及存储介质
动态视觉传感器 姿态特征 情绪特征 深度相机 时序特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号