一种三维开放词汇语义分割模型的训练方法及装置

正文

推荐专利

申请号：CN202510880031

申请日期：2025-06-27

公开号：CN120997837A

公开日期：2025-11-21

类型：发明专利

摘要

本公开属于三维场景理解技术领域，具体涉及一种三维开放词汇语义分割模型的训练方法及装置。所述训练方法包括：获取目标区域的多视角RGB‑D图像，对每个所述图像，通过视觉语言模型进行多阶段推理，生成目标词汇列表并提示二维分割模型建立像素级文本标签，深度映射所述图像生成第一点云，映射所述文本标签至所述第一点云生成逐点文本标签；以所述逐点文本标签为监督信号，预训练具有稀疏编码器‑解码器结构的神经网络模型，在所述第一点云上生成三维分割模型；对目标区域完整场景的第二点云，在共享视觉‑语言特征空间中匹配点特征嵌入与相似度最高的文本嵌入，生成可信点‑文本标签对，并基于此微调所述三维分割模型。

技术关键词

标签语义分割模型稀疏编码器解码器结构深度映射视觉特征神经网络模型多阶段图像场景理解技术列表像素视角文本编码器训练装置

系统为您推荐了相关专利信息

基于知识蒸馏的卫星太阳短波辐射反演方法

地理信息数据反演方法教师学生蒸馏

多标签并行通信的通用参数构建方法及系统

载波参数非暂态计算机可读存储介质多标签散射通信技术

一种基于数字孪生模型的矿井管道流量分析方法

矿井管道数据采集终端流量分析方法数据采集节点数字孪生模型

一种基于两阶段检测模型的烟支外观缺陷的在线检测方法

在线检测方法非线性语义分割模型卷烟生产线上采样

快速查找和删除发布文件的方法、装置、设备和存储介质

非结构化数据处理内容分发网络节点多模态中文标点符号

一种三维开放词汇语义分割模型的训练方法及装置

站点导航

APP 下载