摘要
本发明公开了一种基于多模态视觉大模型的3D高斯单体化、语义化方法,包括以下步骤:S1,进行场景的数据采集,并对采集的数据进行预处理,包括对图像进行语义标注和获得场景的点云信息;S2,构建3D高斯模型,并进行训练和高斯参数的优化;S3,将上述训练并优化参数后的3D高斯模型进行语义化;S4,将3D高斯模型进行单体化;S5,进行实时渲染和交互。本发明实现了多粒度分割并适应各种提示,包括文本提示、点选、涂鸦和2D掩码。该方法能够在几毫秒内完成3D分割,为3D场景的理解和交互提供了新的工具。
技术关键词
语义化方法
单体
语义特征提取
数据管理模块
场景
神经网络训练方法
存储介质上读取
多模态
语义分割模型
随机梯度下降
渲染算法
参数
摄影设备
计算机系统
视觉
图像
系统为您推荐了相关专利信息
虚拟对象
图形用户界面
显示引导信息
游戏信息处理方法
游戏场景
运动特征
连续手语识别方法
特征提取模块
一维卷积神经网络
阶段
三维虚拟场景
三维模型
工作原理信息
计算机程序产品
数据格式
动力电池检测方法
动力电池单体
电池管理系统
有向图模型
电压