基于大模型的深度图生成方法、三维重建方法、装置、电子设备和存储介质

正文

推荐专利

申请号：CN202510830781

申请日期：2025-06-19

公开号：CN120672926A

公开日期：2025-09-19

类型：发明专利

摘要

本公开提供了一种基于大模型的深度图生成方法、三维重建方法、装置、电子设备和存储介质，涉及人工智能技术领域，尤其涉及计算机视觉、深度学习、大模型等技术领域，可应用于实时道路场景深度感知、环境三维重建与避障，以及虚实场景融合等场景下。具体实现方案为：对单目图像进行视觉编码，得到编码图像；将编码图像和目标文本输入预训练大语言模型进行融合，得到融合特征；基于融合特征生成全局引导特征，全局引导特征包括视觉特征和文本特征的联合语义信息；对单目图像的彩色图像添加噪声，得到噪声特征序列；以全局引导特征为条件，对噪声特征序列进行去噪，生成与联合语义信息匹配的隐式特征；基于隐式特征生成深度图。

技术关键词

噪声特征融合特征视觉特征文本图像采集设备三维重建方法彩色图像编码生成深度图大语言模型隐式特征序列深度图生成装置多尺度特征生成方法语义三维重建装置

系统为您推荐了相关专利信息

一种面向一致性学习的样本增强与优化方法

样本专业知识库答案语义文本解析系统

一种基于实体增强的医疗信息抽取方法

信息抽取方法实体细粒度分类 BERT模型文本

融合声学成像的汽车天窗动静音智能检测方法及系统

汽车天窗智能检测方法成像仪图像处理网络噪声图像

一种自动生成用户界面代码的方法、系统、设备和介质

分层数据对象图形用户界面关键字搜索方法文本大语言模型

一种视频监控分析方法、系统及存储介质

监控分析方法深度学习模型视觉特征文本视频监控分析系统

基于大模型的深度图生成方法、三维重建方法、装置、电子设备和存储介质

站点导航

APP 下载