摘要
本申请实施例提供一种三维图像、三维视频、单眼视图以及训练数据集生成方法、设备、存储介质及程序产品。在本申请实施例中,将二维图像作为一个单眼视图,基于二维图像对应的三维场景渲染出带有空洞区域的另一单眼视图;基于注意力机制进行空洞修复以得到不带有空洞区域的另一单眼视图;将两个单眼视图进行合成得到三维图像。同理,基于二维视频生成三维视频。基于二维图像/视频生成三维图像/视频,不再依赖于专业3D拍摄设备,可降低三维图像/视频的制作成本,有利于实现规模化生产。基于三维场景渲染另一单眼视图,更好地模拟人眼视差产生的空洞,提高三维立体效果更好;基于注意力机制对空洞进行修复,修复后的视图保持较高的分辨率。
技术关键词
多尺度特征提取
深度图
空洞
输出特征
融合多尺度特征
三维图像生成方法
交叉注意力机制
视角
三维视频生成方法
视频帧
图像生成模型
场景
文本
人眼
拍摄设备
系统为您推荐了相关专利信息
卷积神经网络模型
同态加密算法
神经网络推理
推理方法
数据加密
Grassmann流形
识别方法
图像局部结构
解剖结构区域
网络结构
标志物筛选方法
位点
一维卷积神经网络
Louvain算法
神经退行性疾病
人脸识别模型
图像生成模型
人脸图像生成方法
年龄
分类器