一种对象识别方法及装置

AITNT
正文
推荐专利
一种对象识别方法及装置
申请号:CN202411740664
申请日期:2024-11-29
公开号:CN119672818A
公开日期:2025-03-21
类型:发明专利
摘要
本发明公开了一种对象识别方法及装置,所述方法包括:采集识别对象的多模态原始数据,所述多模态原始数据至少包括影像数据和音频数据;根据第一预设规则对所述多模态原始数据进行预处理,生成多模态标准数据;根据第二预设规则对多模态标准数据进行特征提取,生成多模态特征数据;根据第三预设规则对多模态特征数据进行融合操作,生成多模态融合数据;根据所述多模态融合数据确定对象识别结果。本发明提高了多模态融合数据中有效信息的密度,丰富描述了对象特征,利于迅速确定对象特征,提高了识别的准确性和识别效率。
技术关键词
对象识别方法 多模态特征 对象识别装置 韵律特征 音频特征 融合规则 对象识别系统 声学特征 文本 生成时序数据 影像 词嵌入技术 图像处理算法 词语
系统为您推荐了相关专利信息
1
一种多模态音频射频融合的无人机分类识别方法
分类识别方法 深度学习网络 无人机 音频特征提取 样本
2
基于模态融合和自进化微调的信息驱动目标分割方法
融合视觉特征 分割方法 适配器 图像编码器 代表
3
一种零样本语音克隆方法和装置
语音声学特征 音频 样本 文本编码器 克隆方法
4
页面测试方法、装置、设备、介质及产品
图像 页面代码 页面测试方法 语义分割模型 光学字符识别
5
一种基于多模态大模型的文档分割方法
文档分割方法 文档特征 文本 多头注意力机制 语义关联度
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号