一种基于文本驱动的三维高斯场景风格化方法

AITNT
正文
推荐专利
一种基于文本驱动的三维高斯场景风格化方法
申请号:CN202411099210
申请日期:2024-08-12
公开号:CN119006760B
公开日期:2025-10-28
类型:发明专利
摘要
本发明公开了一种基于本文驱动的三维高斯场景风格化方法,属于计算机视觉领域。该方法基于深度学习,分为场景重建和风格化两大部分。在重建部分,采集场景的RGB图像序列,使用三维高斯泼溅技术完成重建;在风格化部分,给出目标风格的文本提示,根据风格迁移策略,利用文本‑图像多模态模型技术,将风格文本提示的潜在特征逐步融入场景中,对表征场景的高斯场进行迭代优化,最终得到准确表征场景外观与几何、且符合风格文本要求的三维场景高斯场。本发明只需要输入简单的文本提示,就能达到预期的场景风格化效果,有很强的通用性,为虚拟现实、游戏等领域中构建定制化场景提供了一种可行途径。
技术关键词
文本 表征场景 图像多模态 风格 代表 编码特征 深度卷积神经网络 文字编码器 过滤模块 光栅 视角 误差反向传播 修剪策略 图像编码器 优化场景
系统为您推荐了相关专利信息
1
一种通过定义协议数据自动生成软件工作产品的方法
协议 人机交互界面 生成软件 指令 参数
2
查询变换器的训练方法、多模态大模型预训练方法及电力系统变电站检修方法
变换器 图片 预训练方法 文本 大语言模型
3
一种三电平并网逆变器并联的零序环流分类抑制方法
三电平并网逆变器 环流 并联逆变器系统 三电平逆变器 LCL型滤波器
4
基于大模型的校园智能客服系统及处理方法
答案 大语言模型 校园智能 客服系统 语义
5
一种基于多智能体的混合领域对话方法
对话方法 对话生成方法 索引 实体 文本
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号