摘要
本申请公开了基于大模型的目标定位方法、装置、电子设备及存储介质,涉及计算机技术领域,尤其涉及大模型、语音技术、计算机视觉、深度学习等领域。方案为:接收目标终端发送的定位请求,定位请求包括目标图片及语音指令;从语音指令中提取待定位物体的第一物体信息,根据第一物体信息,对目标图片进行目标检测,获取检测结果;根据候选物体在目标图片中的位置信息,从目标图片中截取候选物体的物体图片;根据物体图片、候选物体在目标图片中的位置信息及第一物体信息,利用大模型,从候选物体中确定目标物体;向终端发送目标物体在目标图片中的位置信息,以使目标终端根据目标物体在目标图片中的位置信息,确定目标物体相对目标终端的位置信息。
技术关键词
物体
图片
终端
文本
定位方法
图像
机器人
电子设备
模块
语音技术
计算机程序产品
机械臂
计算机视觉
处理器通信
指令
可读存储介质
解码
系统为您推荐了相关专利信息
智能匹配系统
语义特征
查询意图
反馈特征
模态特征
智能驾驶场景
数据处理模块
数据标注系统
视角
路面
凭证
结构化编制方法
支持向量机算法
资料
SVR模型