多指令图像识别方法、装置、计算机设备、存储介质

AITNT
正文
推荐专利
多指令图像识别方法、装置、计算机设备、存储介质
申请号:CN202510379235
申请日期:2025-03-28
公开号:CN120375043A
公开日期:2025-07-25
类型:发明专利
摘要
本公开涉及一种多指令图像识别方法、装置、计算机设备、存储介质。所述方法包括:获取全景图像,确定全景图像中搜索区域,搜索区域中包含期望区域;响应于检测到与期望区域存在关联的语音信息,以语音信息作为引导条件,并利用预先训练得到的图像处理模型对搜索区域进行处理,输出掩膜图像;基于掩膜图像和搜索区域,确定期望区域。采用本方法能够有效融合语音信息,准确的确定期望区域。
技术关键词
图像处理模型 编码 图像识别方法 语音 解码 掩膜 计算机设备 拍摄设备 图像识别装置 残差模块 参数 数据 处理器 可读存储介质 存储器 物体
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号