摘要
本发明提供了一种基于视差补偿和深度学习的双目视频压缩方法,方法首先获取训练数据并进行预处理,然后构建双目视频压缩网络,双目视频压缩网络包括运动估计网络、运动信息压缩网络、运动补偿网络、双目视频帧信息压缩网络和帧重建网络,接着对双目视频压缩网络进行有监督的训练,并利用训练好的双目视频压缩网络进行视频压缩处理,该方法在运动信息压缩网络和双目帧信息压缩网络中设置了双目特征交互模型和双目熵模型,双目特征交互模型在编解码过程中利用混合视差补偿机制对齐双目视角特征,双目熵模型通过自回归概率估计进行精准的概率分布建模。本发明能够在保证重建质量的同时显著提升压缩性能,适用于虚拟现实、自动驾驶等需要高效双目视频处理的场景。
技术关键词
采样模块
视角
网络
视差补偿
视频压缩方法
交互模型
信息解码器
信息编码器
上采样
解码信息
对齐模块
视频帧信息
运动信息编解码
运动估计
运动补偿
非线性