摘要
本发明公开了一种基于相机位姿光场编码的新视点图像合成方法,包括:设计了一种两阶段训练的场景新视点合成模型;确定了一种位姿光场编码方案,将视点位姿编码为目标分辨率的位姿光场;提供了一种有效的训练策略;有益效果是:本发明基于Transformer模块的优势,训练了一个具备大量先验的场景潜在表示编码模型与一个场景新视点合成模块。再通过引入一种位姿光场编码,解决了视点控制不精确的问题,并优化了传统的基于像素光线渲染的生成速度。本发明在训练中引入了一个目标位姿的随机加噪过程,有效避免了第二阶段训练中对特定目标位姿的过拟合现象,使得生成模型的泛化性与生成质量都得到了较大提升。
技术关键词
编码模块
注意力
相机
编码器
编解码模块
分辨率
图像生成模型
偏移噪声
图像块
线性
训练场景
矩阵
编码方案
框架
网络
系统为您推荐了相关专利信息
多语种语音
声学特征
识别语音信号
识别方法
模块
电力变压器故障
电力设备故障
识别方法
分支
信号
检测相机
透明转盘
图像采集装置
水平检测仪
三维食品