一种基于多模态视觉大模型的3D高斯单体化、语义化方法

正文

推荐专利

申请号：CN202510148084

申请日期：2025-02-11

公开号：CN120164125B

公开日期：2025-11-18

类型：发明专利

摘要

本发明公开了一种基于多模态视觉大模型的3D高斯单体化、语义化方法，包括以下步骤：S1，进行场景的数据采集，并对采集的数据进行预处理，包括对图像进行语义标注和获得场景的点云信息；S2，构建3D高斯模型，并进行训练和高斯参数的优化；S3，将上述训练并优化参数后的3D高斯模型进行语义化；S4，将3D高斯模型进行单体化；S5，进行实时渲染和交互。本发明实现了多粒度分割并适应各种提示，包括文本提示、点选、涂鸦和2D掩码。该方法能够在几毫秒内完成3D分割，为3D场景的理解和交互提供了新的工具。

技术关键词

语义化方法单体语义特征提取数据管理模块场景神经网络训练方法存储介质上读取多模态语义分割模型随机梯度下降渲染算法参数摄影设备计算机系统视觉图像

系统为您推荐了相关专利信息

游戏信息处理方法、装置、程序产品与电子设备

虚拟对象图形用户界面显示引导信息游戏信息处理方法游戏场景

一种基于方向敏感长时运动解耦的连续手语识别方法

运动特征连续手语识别方法特征提取模块一维卷积神经网络阶段

无文件攻击场景图确定方法、装置、电子设备和可读介质

节点标签卷积神经网络模型进程警报

一种基于虚幻引擎的充电桩检定三维场景构建的方法

三维虚拟场景三维模型工作原理信息计算机程序产品数据格式

一种基于故障类型识别的船舶用动力电池检测方法

动力电池检测方法动力电池单体电池管理系统有向图模型电压

一种基于多模态视觉大模型的3D高斯单体化、语义化方法

站点导航

APP 下载