自动驾驶场景的语义分割交互标注方法及相关装置

正文

推荐专利

申请号：CN202510748822

申请日期：2025-06-05

公开号：CN120279555B

公开日期：2025-08-19

类型：发明专利

摘要

本申请公开了一种自动驾驶场景的语义分割交互标注方法及相关装置，方法包括获取图像嵌入和提示嵌入；将提示嵌入和初始化的预测令牌拼接，得到令牌嵌入；将令牌嵌入与图像嵌入组成映射输入transformer模块中，通过多头注意力机制更新令牌嵌入并融合提示嵌入和图像嵌入，生成上下文感知的中间表示；将更新后的掩码令牌输入分类头中，预测掩码令牌对应掩码的感兴趣区域的目标类型。本申请无需庞大的分类数据集，仅通过添加分类分支，即可在开源算法基础上微调自己的数据集，有效解决了现有技术中串联SAM模型和分类模型存在的分类参数过大、推理速度过慢、对机器配置要求过高、影响交互式标注体验的技术问题。

技术关键词

令牌图像嵌入标注方法生成上下文感知多头注意力机制语义感兴趣多层感知机双层编码器编码向量机器可读存储介质存储器存储指令指针对象标注装置拼接模块场景解码模块

系统为您推荐了相关专利信息

一种基于自适应剪枝技术的夜间跨镜行人追踪方法

令牌行人追踪方法图像剪枝技术注意力

点云数据处理方法、装置、设备、介质及程序产品

加权特征语义特征点云数据处理方法令牌融合特征

一种边缘计算环境下元强化学习驱动的自适应任务卸载机制

边缘计算环境多头注意力机制卸载策略策略更新递归神经网络建模

复杂城市环境路径损耗智能预测方法及存储介质

智能预测方法融合卷积神经网络搜索优化系统混合网络模型三维场景数据

基于CT图像的单发肺结节恶性程度的混合自监督学习方法

冠状动态字典图像编码器解码器

自动驾驶场景的语义分割交互标注方法及相关装置

站点导航

APP 下载