一种基于字幕感知预训练的多任务网络道路目标检测方法

正文

推荐专利

申请号：CN202510261927

申请日期：2025-03-06

公开号：CN120198871A

公开日期：2025-06-24

类型：发明专利

摘要

本发明公开了一种基于字幕感知预训练的多任务网络道路目标检测方法，包括两阶段训练：第一阶段通过图像编码器与字幕感知解码器的联合训练，利用自动驾驶场景图像及其对应的文本标注数据进行预训练，优化图像编码器。第二阶段基于预训练的图像编码器和多任务解码器头，使用包含目标检测、车道线检测与可行驶区域分割标注数据的训练集进行联合训练。该方法通过优化多任务损失函数，实现了多任务学习的协同提升，增强了图像目标检测的精度和鲁棒性。具体来说，目标检测通过边界框回归，车道线检测通过位置标定，可行驶区域通过图像分割实现。该方法可广泛应用于自动驾驶系统中的道路目标检测，提高了场景理解与决策精度。

技术关键词

图像编码器解码器字幕卷积模块网络车道采样模块文本特征向量检测损失数据检测头多任务损失函数传播算法场景自动驾驶系统注意力

系统为您推荐了相关专利信息

一种基于系统划分模型修正下的齿轮传动系统振动响应快速预测方法

齿轮传动系统 Kriging模型子系统有限元分析软件多体动力学模型

基于机器视觉的电站设备表计识别与状态评估机器人系统

评估机器人电站设备表计拓扑网络邻居

一种基于动态加权小波注意力的人脸识别方法及系统

人脸识别方法空间金字塔池化高频特征特征金字塔网络人脸识别模型

隧道大温差段混凝土冻融损伤评价方法、装置、设备及介质

损伤评价方法深度卷积神经网络评价图像混凝土大温差

基于边缘和细节共导拓扑感知的视网膜血管图像分割方法

视网膜血管图像分支注意力卷积模块眼底视网膜

一种基于字幕感知预训练的多任务网络道路目标检测方法

站点导航

APP 下载