基于语义指导的零样本泛化三维物体重建方法

正文

推荐专利

申请号：CN202510090805

申请日期：2025-01-21

公开号：CN120047615B

公开日期：2025-12-05

类型：发明专利

摘要

本发明涉及一种基于语义指导的零样本泛化三维物体重建方法，属于计算机视觉和图像处理技术领域。该方法包括：利用了分数蒸馏采样策略在单幅图像三维重建过程中的优越性；设计提示词，指导多模态大语言模型生成对图像从粗粒度到细粒度的描述，指导三维结果的生成；采用了一种多模态数据对齐的策略，实现语义和视觉模态的对齐，将语义信息融入到生成的三维结构中。本发明能够以零样本泛化解决单幅图像生成三维物体结构的问题，并在真实数据集中对本发明进行实验验证，证明了本发明的优越性。

技术关键词

三维物体重建方法隐式结构大语言模型多视角三维结构样本多模态网络生成三维物体噪声语义特征深度图文本编码器图像编码器法线贴图

系统为您推荐了相关专利信息

一种基于人工智能技术的幼儿对话系统

幼儿对话系统人工智能机器人数据储存模块教师

大语言模型的任务感知解码方法、装置、设备及存储介质

大语言模型解码方法标签解码装置处理器

用于大语言模型的模型评估方法、装置、介质及设备

模型评估方法评估工作流大语言模型节点指令

一种基于大模型的影视剧智能缩编方法

影视剧大语言模型行人重识别算法视频场景分割脚本

基于视频大语言模型的手术视频分析方法及相关设备

大语言模型视频分析方法文本手术语言模块

基于语义指导的零样本泛化三维物体重建方法

站点导航

APP 下载