一种对象识别方法及装置

正文

推荐专利

一种对象识别方法及装置

申请号：CN202411740664

申请日期：2024-11-29

公开号：CN119672818A

公开日期：2025-03-21

类型：发明专利

摘要

本发明公开了一种对象识别方法及装置，所述方法包括：采集识别对象的多模态原始数据，所述多模态原始数据至少包括影像数据和音频数据；根据第一预设规则对所述多模态原始数据进行预处理，生成多模态标准数据；根据第二预设规则对多模态标准数据进行特征提取，生成多模态特征数据；根据第三预设规则对多模态特征数据进行融合操作，生成多模态融合数据；根据所述多模态融合数据确定对象识别结果。本发明提高了多模态融合数据中有效信息的密度，丰富描述了对象特征，利于迅速确定对象特征，提高了识别的准确性和识别效率。

技术关键词

对象识别方法多模态特征对象识别装置韵律特征音频特征融合规则对象识别系统声学特征文本生成时序数据影像词嵌入技术图像处理算法词语

系统为您推荐了相关专利信息

一种多模态音频射频融合的无人机分类识别方法

分类识别方法深度学习网络无人机音频特征提取样本

基于模态融合和自进化微调的信息驱动目标分割方法

融合视觉特征分割方法适配器图像编码器代表

一种零样本语音克隆方法和装置

语音声学特征音频样本文本编码器克隆方法

页面测试方法、装置、设备、介质及产品

图像页面代码页面测试方法语义分割模型光学字符识别

一种基于多模态大模型的文档分割方法

文档分割方法文档特征文本多头注意力机制语义关联度

一种对象识别方法及装置

站点导航

APP 下载