摘要
本发明公开了一种对象识别方法及装置,所述方法包括:采集识别对象的多模态原始数据,所述多模态原始数据至少包括影像数据和音频数据;根据第一预设规则对所述多模态原始数据进行预处理,生成多模态标准数据;根据第二预设规则对多模态标准数据进行特征提取,生成多模态特征数据;根据第三预设规则对多模态特征数据进行融合操作,生成多模态融合数据;根据所述多模态融合数据确定对象识别结果。本发明提高了多模态融合数据中有效信息的密度,丰富描述了对象特征,利于迅速确定对象特征,提高了识别的准确性和识别效率。
技术关键词
对象识别方法
多模态特征
对象识别装置
韵律特征
音频特征
融合规则
对象识别系统
声学特征
文本
生成时序数据
影像
词嵌入技术
图像处理算法
词语
系统为您推荐了相关专利信息
分类识别方法
深度学习网络
无人机
音频特征提取
样本
图像
页面代码
页面测试方法
语义分割模型
光学字符识别
文档分割方法
文档特征
文本
多头注意力机制
语义关联度