摘要
本公开提供了一种多任务模型训练方法,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于自动驾驶等场景。该方法包括:将感知图像样本分别输入预训练的单任务模型和待训练的多任务模型中的特征提取网络,得到单任务特征和多任务特征;多任务模型的其中一个子任务分支与单任务模型的任务相同;基于单任务模型的任务类型,确定的单任务特征和多任务特征之间的蒸馏损失;基于蒸馏损失,对多任务模型的特征提取网络进行参数更新以对多任务模型进行训练;特征提取网络由多任务模型中各个子任务分支共享。本公开解决了多任务负迁移问题,提高了多任务模型的性能。
技术关键词
多任务
特征提取网络
蒸馏
检测解码器
分支
样本
图像
障碍物
车道
参数更新模块
处理器
特征提取模块
人工智能技术
计算机程序产品
计算机视觉
非线性
训练装置
系统为您推荐了相关专利信息
降血糖固体饮料
深度学习模型
数据平衡技术
生成方法
固体饮料配方
点自动识别方法
检测网络模型
描述符
注意力
混合损失函数
数据处理装置
无人机
数据处理系统
特征提取单元
数据采集模块
系统故障检测方法
教师
故障类别
数据中心
多模态