一种基于扩散模型的三维形状描述方法

正文

推荐专利

一种基于扩散模型的三维形状描述方法

申请号：CN202510521472

申请日期：2025-04-24

公开号：CN120450945A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于扩散模型的三维形状描述方法，涉及计算机视觉与自然语言处理领域，包括以下步骤：对三维模型进行多视角二维渲染，生成多张二维投影图像；利用预训练的视觉语言模型提取所述二维投影图像的图像嵌入表示以及文本嵌入表示，并生成联合嵌入表示；基于所述联合嵌入表示，通过扩散模型进行正向加噪以及反向去噪，生成多视角下的描述文本；对多视角下的描述文本进行整合，获得对应的三维形状描述结果。该方法通过多视角渲染和ViLT模型提取联合嵌入表示，结合扩散模型生成多样化高质量描述文本，并采用最大池化聚合策略优化整体描述一致性，显著提升了三维形状描述的准确性和自然度。

技术关键词

图像嵌入多视角文本三维模型噪声强度贝叶斯风险自然语言平方根变量计算机视觉机制网络策略参数解码相机编码

系统为您推荐了相关专利信息

一种基于深度学习的专利摘要智能生成系统

摘要智能生成系统词语样本序列特征

充电控制方法、装置、设备、存储介质及产品

充电控制方法移动式充电控制程序力觉传感器二维图像特征

一种基于深度识别算法的无人机识别方法及系统

像素点图谱文本预测类别无人机识别方法

一种基于多模态数据融合的设备状态监控方法及系统

设备状态监控方法多模态数据融合文本交叉注意力机制设备状态监控系统

基于人工智能的数据处理方法、装置、电子设备及介质

数据处理模型数据处理方法影像特征提取模块融合特征

一种基于扩散模型的三维形状描述方法

站点导航

APP 下载