摘要
本申请公开了一种模型训练方法、图像感知方法、装置及相关设备,方法包括:获取样本车辆所处环境的第一图像序列,以及第一图像序列对应的第一教师语言描述文本,第一教师语言描述文本用于对第一图像序列中的场景进行描述;对第一教师语言描述文本进行语义编码,得到第一教师语言语义向量;将第一图像序列输入至学生模型进行视觉特征提取,得到多尺度特征图和第一学生视觉向量,第一学生视觉向量根据多尺度特征图计算得到;根据第一教师语言语义向量和第一学生视觉向量,得到目标损失值;根据目标损失值对学生模型进行训练,直到满足预设的迭代停止条件,得到目标模型。由于学生模型可以选用轻量级的模型,可降低目标模型部署所需要的资源。
技术关键词
模型训练方法
多尺度特征
语义向量
教师
学生
序列
计算机程序指令
视觉特征提取
文本
样本
检测头
图像感知装置
注意力
特征提取模块
计算机程序产品
系统为您推荐了相关专利信息
锂电池热失控
声音检测方法
图像分析
多模态
多尺度特征融合
上下文语义信息
矫正
特征金字塔网络
新型损失函数
融合图像信息
智慧校园管理方法
教师
智慧校园管理系统
时间段
学生
标签生成方法
图像
边缘检测模型
模型训练方法
测量方法