一种基于层级语义场的三维场景语义查询方法

正文

推荐专利

申请号：CN202510596914

申请日期：2025-05-09

公开号：CN120526025A

公开日期：2025-08-22

类型：发明专利

摘要

一种基于层级语义场的开放词汇三维场景语义查询方法，通过零样本分割模型SAM提取子部分、部分和整体层级的实例掩码，结合CLIP编码器生成像素级多粒度语义特征图；改进神经辐射场架构，设计多分辨率哈希网格与多头多层感知机网络，实现三维空间坐标到多层级语义特征的高效映射，并引入区域对比损失和特征一致性损失约束跨视角语义一致性；在推理阶段，通过计算文本特征与渲染语义特征的相似度自适应选择最优层级，生成高精度语义分割结果。本发明突破传统方法依赖裁剪图像块导致的特征模糊问题，解决了开放词汇场景下语义查询精度低、多粒度理解不足及跨视角冲突的难题，为三维场景交互提供了细粒度、鲁棒性强的自然语言驱动解决方案。

技术关键词

语义查询方法语义特征层级多层感知机场景多分辨率特征图像提取特征实例标识符优化网络参数生成热力图视角编码结构计算机程序产品场结构文本网格

系统为您推荐了相关专利信息

面向智能家居边端部署的多媒体问答模型量化方法

编解码器模型面向智能家居问答模型答案多媒体

车辆故障检测方法、装置、电子设备及可读存储介质

车辆运行数据车辆故障检测方法文本大语言模型车辆故障检测装置

基于世界模型的端到端自动驾驶系统闭环对抗测试方法

自动驾驶系统交通车全局状态信息代表策略

一种增强现实游戏的实时渲染方法

游戏物体渲染方法渲染结构着色虚拟对象

一种基于多模态特征融合的漏洞检测方法

多模态特征融合函数调用关系语义向量焦点损失函数抽象语法树

一种基于层级语义场的三维场景语义查询方法

站点导航

APP 下载