摘要
本公开涉及一种多指令图像识别方法、装置、计算机设备、存储介质。所述方法包括:获取全景图像,确定全景图像中搜索区域,搜索区域中包含期望区域;响应于检测到与期望区域存在关联的语音信息,以语音信息作为引导条件,并利用预先训练得到的图像处理模型对搜索区域进行处理,输出掩膜图像;基于掩膜图像和搜索区域,确定期望区域。采用本方法能够有效融合语音信息,准确的确定期望区域。
技术关键词
图像处理模型
编码
图像识别方法
语音
解码
掩膜
计算机设备
拍摄设备
图像识别装置
残差模块
参数
数据
处理器
可读存储介质
存储器
物体