基于场景语义及几何约束的三维场景自动生成方法及系统

正文

推荐专利

申请号：CN202510756822

申请日期：2025-06-09

公开号：CN120278911B

公开日期：2025-08-05

类型：发明专利

摘要

本申请公开了基于场景语义及几何约束的三维场景自动生成方法及系统，属于深度学习技术领域，包括：本发明提出一种创新的基于混合离散‑连续扩散模型架构的三维室内场景生成方法，即跨模态KanMiDiffusion算法。首先对MiDiffusion模型进行了介绍，并在此基础上，通过整合Bert文本编码器和Dinov2视觉编码器，以及引入Kolmogorov‑Arnold网络来优化几何特征映射，提出了跨模态KanMiDiffusion算法。本发明详细阐述了算法的网络架构，包括视觉‑文本预训练模型的集成和多模态特征交互模块的设计，通过仿真实验验证，验证了本发明所提方法能够提高场景生成的语义和几何精度。

技术关键词

自动生成方法编码特征融合特征文本编码器语义标签解码器网络场景生成方法注意力表达式自动生成系统数学视觉深度学习技术编码器模块平面图

系统为您推荐了相关专利信息

基于人工智能的数据处理方法、装置、电子设备及介质

数据处理模型数据处理方法影像特征提取模块融合特征

一种双域先验增强的高效低剂量CT重建方法及装置

高频特征 CT重建方法融合特征图像增强编码器

模态不完整条件下的视频虚假信息跨域检测方法及系统

模态特征样本多模态语义联合损失函数

一种基于耦合图的多尺度时空融合交通流量预测方法

交通流量预测方法时空融合特征时序特征路网结构语义特征

一种巡检方法及系统

巡检机器人历史故障数据故障概率模型设备运行状态数据巡检方法

基于场景语义及几何约束的三维场景自动生成方法及系统

站点导航

APP 下载