基于OCR技术的图像识别方法

正文

推荐专利

基于OCR技术的图像识别方法

申请号：CN202510375338

申请日期：2025-03-27

公开号：CN120356223A

公开日期：2025-07-22

类型：发明专利

摘要

本发明提供基于OCR技术的图像识别方法，属于图像处理技术领域，其方法包括获取多个图像数据与所述图像数据对应的音频数据，提取图像数据的图像特征与原始音频特征；将图像特征与原始音频特征进行特征融合，基于特征融合结果设计多模态神经网络，进而根据所述多模态神经网络构建识别模型；使用所述识别模型对待识别图像进行识别，并输出识别报告，提升识别的准确性和鲁棒性，更全面地理解图像内容，减少误识别的可能性，提升识别结果的合理性与识别过程的广泛性。

技术关键词

图像识别方法音频特征神经网络架构多模态合成器中间层图像特征向量文本数据生成图像特征样本报告图像处理技术标签参数索引鲁棒性标记

系统为您推荐了相关专利信息

基于摆动光束及熔池状态在线监测的异种金属激光焊接装置

激光焊接装置轨迹参数激光焊接头高风险轨迹形状

基于人工智能的虚拟人设计与应用平台及方法、设备、介质

多模态模态特征长短期记忆网络时序特征意图

一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质

生成对抗网络模型多模态特征融合深度卷积神经网络数据梅尔频率倒谱系数

基于多模态融合的机器视觉情感识别与交互系统及其方法

识别偏差情绪识别模型情绪特征交互方法多模态情绪

一种医疗器械注册证OCR识别系统

识别系统医疗器械图像增强单元文本识别模型校验模块

基于OCR技术的图像识别方法

站点导航

APP 下载