基于大模型的三维图像重建方法、训练方法、装置、设备和介质

正文

推荐专利

申请号：CN202510337028

申请日期：2025-03-20

公开号：CN120198592A

公开日期：2025-06-24

类型：发明专利

摘要

本公开提供了一种基于大模型的三维图像重建方法，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型、元宇宙、虚拟现实、增强现实等技术领域。具体实现方案为：基于隐式提示信息对待重建图像进行推理分割，确定待重建图像中的至少一个候选对象并为至少一个候选对象添加掩码，得到分割图像；对待重建图像进行几何重建，得到三维网格模型，三维网格模型表征至少一个候选对象的几何信息和待重建图像重建场景的几何信息；对分割图像和三维网格模型进行融合，得到至少一个候选对象的三维重建结果；以及将隐式提示信息和至少一个候选对象的三维重建结果输入第一大语言模型，输出由隐式提示信息指示的目标对象的三维重建结果。本公开还提供了一种基于大模型的训练方法、装置、电子设备和存储介质。

技术关键词

三维网格模型大语言模型三维图像重建方法对象图像重建装置图像嵌入距离信息数据融合特征语义图像编码显示装置模型训练装置输入输出模块模型训练方法电子设备

系统为您推荐了相关专利信息

基于多模态大语言模型的智能工具柜系统及控制方法

智能工具柜系统大语言模型多模态识别模块数据处理模块

一种基于RAG框架的知识库文件上传一致性保障方法及装置

数据框架保障方法大语言模型可读存储介质

信息处理方法、装置、设备、介质及程序产品

动态知识图谱权重分配策略指数对象计算机执行指令

分拣机器人的控制装置及方法

主控子系统分拣机器人图像采集设备视觉对象

大纲生成方法和装置

字符生成文档大语言模型生成方法主题

基于大模型的三维图像重建方法、训练方法、装置、设备和介质

站点导航

APP 下载