摘要
本发明属于图像识别相关技术领域,其公开了一种图像识别系统及其训练方法、图像识别方法,该系统中:粗粒度场景感知模块识别出与输入图像最相关的场景;细粒度目标感知模块基于粗粒度场景感知模块所提供的信息计算各特征点与最相关场景下各目标的相似度得分;编码模块具有多分支自注意力计算单元,多分支注意力计算单元基于相似度得分将显著性特征点加入同一个自注意力分支,形成多分支自注意力图像编码,着重对所加入的显著性特征进行编码计算;解码模块对编码特征进行解码,识别输入图像中的目标。通过以上系统,可以降低编码器的计算复杂度,提高重点目标的特征提取能力,减少不同类别目标和图像背景区域的干扰,加快图像处理速度。
技术关键词
图像识别系统
语义向量
特征点
编码特征
图像识别方法
注意力
多分支
编码模块
解码模块
标签标记图像
融合语义
场景类别
特征提取模块
特征提取能力
文本编码器
图像编码器
系统为您推荐了相关专利信息
图像
三维位置信息
定位方法
模板匹配算法
边缘检测
专注度评估方法
累积直方图
多模态特征融合
摄像机
图像
控制数据流
识别神经网络
数据项
智能化开关柜
智能控制方法
全景图像数据
三维点云数据
模型构建方法
三维全景图像
特征点