摘要
本申请公开了基于场景语义及几何约束的三维场景自动生成方法及系统,属于深度学习技术领域,包括:本发明提出一种创新的基于混合离散‑连续扩散模型架构的三维室内场景生成方法,即跨模态KanMiDiffusion算法。首先对MiDiffusion模型进行了介绍,并在此基础上,通过整合Bert文本编码器和Dinov2视觉编码器,以及引入Kolmogorov‑Arnold网络来优化几何特征映射,提出了跨模态KanMiDiffusion算法。本发明详细阐述了算法的网络架构,包括视觉‑文本预训练模型的集成和多模态特征交互模块的设计,通过仿真实验验证,验证了本发明所提方法能够提高场景生成的语义和几何精度。
技术关键词
自动生成方法
编码特征
融合特征
文本编码器
语义标签
解码器
网络
场景生成方法
注意力
表达式
自动生成系统
数学
视觉
深度学习技术
编码器模块
平面图
系统为您推荐了相关专利信息
数据处理模型
数据处理方法
影像
特征提取模块
融合特征
高频特征
CT重建方法
融合特征
图像增强
编码器
交通流量预测方法
时空融合特征
时序特征
路网结构
语义特征
巡检机器人
历史故障数据
故障概率模型
设备运行状态数据
巡检方法