摘要
本发明公开了一种融入自注意力机制的实时中间流估计算法,涉及计算机视觉技术领域,包括以下步骤:获取相邻的两帧视频图像和;构建图像金字塔,对输入帧进行降采样处理;使用改进的IFNet估计中间流和,其中IFNet采用"粗到细"的光流估计策略,且在IFBlock模块中引入自注意力机制;使用估计的中间流对输入帧进行反向光流扭曲,生成初步中间帧;使用FusionNet融合多源信息,生成最终的中间帧,其中FusionNet在编码器中引入自注意力机制。该融入自注意力机制的实时中间流估计算法,通过引入自注意力机制,模型能够捕捉图像中的全局运动信息,提高光流估计的准确性。
技术关键词
注意力机制
估计算法
融合多源信息
图像金字塔
编码器
矩阵
计算机视觉技术
模块
解码器
分辨率
策略
视频
非线性
像素
关系
运动
数据
系统为您推荐了相关专利信息
递归残差网络
GRU神经网络
识别方法
门控循环单元网络
融合特征
轨迹预测系统
编解码器
输出模块
动态
行人轨迹预测技术
超声图像检测方法
sigmoid函数
交叉注意力机制
图像检测模型
图像检测系统