摘要
本发明公开了一种基于事件相机重建参考的多模态视频插帧方法,首先通过事件生成模型从高速视频中生成事件流并与帧在时间尺度上对齐,保证训练过程中能够在任意时刻进行视频内插帧。事件流被处理为体素以及事件关注掩码,体素被输入参考帧重建网络生成参考帧。经过事件关注掩码策略处理的参考帧和视频帧一起输入基于参考帧的合成网络进行双向对齐,从而合成粗插入帧。最后将粗插入帧、事件体素以及两个视频关键帧一起被输入插入帧细化网络来生成清晰的插入帧。本发明利用基于事件的参考直接合成中间帧,避免了显式运动估计的必要性,从而大大增强了处理运动遮挡的能力。
技术关键词
视频插帧方法
事件相机
金字塔结构
事件流数据
关键帧
残差模块
网络模块
注意力
生成事件
事件生成器
更新网络参数
网格
掩码策略
图像
退火算法
像素
系统为您推荐了相关专利信息
员工
实时语音
工厂管理系统
人机交互方法
人体模型
镜头罩
屏式过热器
针孔镜头
相机保护罩
深度学习网络算法
事件特征
事件流数据
交叉注意力机制
图像
融合多模态特征
关键帧提取算法
强化学习算法
图像
视频流
垃圾分类系统