摘要
本发明公开了一种基于本文驱动的三维高斯场景风格化方法,属于计算机视觉领域。该方法基于深度学习,分为场景重建和风格化两大部分。在重建部分,采集场景的RGB图像序列,使用三维高斯泼溅技术完成重建;在风格化部分,给出目标风格的文本提示,根据风格迁移策略,利用文本‑图像多模态模型技术,将风格文本提示的潜在特征逐步融入场景中,对表征场景的高斯场进行迭代优化,最终得到准确表征场景外观与几何、且符合风格文本要求的三维场景高斯场。本发明只需要输入简单的文本提示,就能达到预期的场景风格化效果,有很强的通用性,为虚拟现实、游戏等领域中构建定制化场景提供了一种可行途径。
技术关键词
文本
表征场景
图像多模态
风格
代表
编码特征
深度卷积神经网络
文字编码器
过滤模块
光栅
视角
误差反向传播
修剪策略
图像编码器
优化场景
系统为您推荐了相关专利信息
三电平并网逆变器
环流
并联逆变器系统
三电平逆变器
LCL型滤波器