摘要
本发明公开了一种基于多模态知识蒸馏的矿物识别方法、系统及存储介质,涉及矿物识别技术领域,所述矿物识别方法包括:获取各类矿物图像及物理属性数据,并将其进行编码;将各类矿物图像及编码后向量输入混合矿物识别模型中,得到各矿物类别概率;其中,使用矿物图像和编码后向量训练多模态教师模型,以多模态教师模型训练单模态学生模型,通过知识蒸馏策略将多模态教师模型学习到的矿物类别相似性关系及物理属性特征迁移至单模态学生模型;若输入数据仅包含矿物图像,则使用训练好的单模学生模型输出各矿物类别概率,否则使用多模态教师模型输出各矿物类别概率。本发明能够融合多模态特征提升矿物识别准确率,并在缺乏物理属性时仍保持高精度。
技术关键词
矿物识别方法
教师
蒸馏
学生
图像特征信息
编码向量
物理
图像特征向量
矿物识别技术
融合多模态特征
编码规则
颜色
编码器
非线性
变换器
融合特征
识别模块
系统为您推荐了相关专利信息
三维重建算法
投影图像信息
局部特征信息
物体特征信息
判别特征
变电站倒闸
变电站设备状态
动态融合方法
识别方法
语义特征提取