摘要
本申请公开了一种对象追踪方法、装置、存储介质及机器人,涉及机器人技术领域,该方法包括:采集待识别对象的对象数据;当所述对象数据中包括对象图像及声纹信息时,采用第一识别模型将所述对象图像及所述声纹信息进行特征提取及跨模态特征融合,以基于跨模态融合特征确定所述待识别对象是否为目标对象;当所述对象数据中包括所述对象图像时,采用第二识别模型基于所述对象图像进行身份识别,以确定所述待识别对象是否为目标对象。本申请可以提升机器人的对象追踪准确性和成功率。此外,还可以智能动态地充分借助并提取声音、人脸、人体中一个或多个数据,提升机器人在全场景的对象追踪准确性和成功率。
技术关键词
跨模态融合特征
对象追踪方法
图像
模态特征
多尺度特征提取
对象追踪装置
数据
身份
多头注意力机制
二分类模型
识别模块
机器人技术
语音
动态地
存储器