目标定位方法、装置、电子设备及计算机存储介质

正文

推荐专利

申请号：CN202410825900

申请日期：2024-06-25

公开号：CN118784924A

公开日期：2024-10-15

类型：发明专利

摘要

发明提供一种目标定位方法、装置、电子设备及计算机存储介质，涉及智能数据分析技术领域，在本发明实施例中，对于按照出现台词的时间提取的视觉特征和音频特征利用交叉注意力机制和自注意力机制进行特征融合和增强，以提高后需利用预先建立的目标定位模型进行预测时，输出的目标定位结果的精确度，实现基于提高精确度的目标定位结果对正在说话的目标进行精确定位，提升正在说话的目标的识别准确率的目的。

技术关键词

音视频交叉注意力机制音频特征样本视觉特征定位方法计算机存储介质网络模型训练智能数据分析技术输入神经网络模型卷积神经网络模型电子设备时序深度学习模型

目标定位方法、装置、电子设备及计算机存储介质

站点导航

APP 下载