Transformer与CNN相结合的视频插帧方法

正文

推荐专利

申请号：CN202410708537

申请日期：2024-06-03

公开号：CN118828058A

公开日期：2024-10-22

类型：发明专利

摘要

本发明公开了Transformer与CNN相结合的视频插帧方法。本发明的网络结构包括特征提取网络、光流估计网络和融合与细化网络。特征提取网络不同阶段的输出作为不同尺度的特征，光流估计网络通过对前后两帧视频图像进行特征提取和运动估计，生成前后两帧到中间帧的双向光流信息，融合与细化网络输入为特征提取网络提取的不同阶段的特征信息、光流估计网络生成的输出光流，输出为一张掩膜图像以及一副残差图像。原始图像经过光流的绘制，再通过掩膜做加权最后加上残差图像，输出最终的插帧图像。本发明通过Transformer模型与CNN网络相结合，能够从整个图像范围内提取丰富的语义信息，并有效地捕捉帧间的运动关系。

技术关键词

特征提取网络视频插帧方法阶段运动估计图像全局特征位置编码信息掩膜多尺度特征提取分支多头注意力机制图像多尺度网络结构卷积模块语义特征令牌滑动窗口图像分割

系统为您推荐了相关专利信息

一种高效鲁棒的城市信息模型非空间数据匹配方法及系统

空间数据匹配方法城市信息模型编辑距离算法元素编码技术

一种基于多视角特征表达及优选的跨任务EEG解码方法

Pearson相关系数多视角特征特征提取网络解码方法联合特征提取

基于导航坐标系ESKF算法和机动加速度分段隔离的飞机姿态估计方法

导航坐标系姿态估计方法加速度姿态误差飞机

一种金融输电权下电网项目投资组合决策方法、装置、设备和存储介质

电网投资项目决策方法金融搜索算法数据

一种基于自适应文本提示的zero-shot图像识别方法

提示方法预训练模型数据标签图像识别方法前馈神经网络

Transformer与CNN相结合的视频插帧方法

站点导航

APP 下载