摘要
本发明涉及数据处理技术领域,具体涉及一种基于多视图知识蒸馏的图像识别方法,包括:通过成像设备获取单一目标在不同视角下的多个成像视图;教师网络对多个视图分别进行卷积辅助分支和注意力辅助分支的并行特征提取;将两个分支生成的辅助特征并行输入多视图对位加权模块进行多视图对应位置间的特征融合;利用融合后的特征向量预测目标在单视角和多视角下的类别概率并使用真实标签进行监督;学生模型对多个视图分别进行原型特征提取;利用师生训练框架对学生网络在真实标签和教师预测标签的监督下进行训练,得到轻量化多视图模型;解决了现阶段多视图识别模型参数量大、训练和推理成本较高、推理速度慢的问题。
技术关键词
图像识别方法
并行特征提取
标签
视角
分支
教师
原型
学生
蒸馏
成像设备
网络
注意力
输出特征
图像块特征
数据处理技术
多层感知机
分类器
编解码器
系统为您推荐了相关专利信息
视频采集设备
信息显示方法
动作识别模型
设备运行数据
序列
无标签数据
网络
预后预测方法
图像特征提取模型
对象
影像匹配方法
无人机图片
三维重建模型
图像
视角
大语言模型
问答方法
阶段
数据
计算机可执行指令
意图类别
实体识别模型
交互式智能
文本
大语言模型