基于OCR技术的图像识别方法

AITNT
正文
推荐专利
基于OCR技术的图像识别方法
申请号:CN202510375338
申请日期:2025-03-27
公开号:CN120356223A
公开日期:2025-07-22
类型:发明专利
摘要
本发明提供基于OCR技术的图像识别方法,属于图像处理技术领域,其方法包括获取多个图像数据与所述图像数据对应的音频数据,提取图像数据的图像特征与原始音频特征;将图像特征与原始音频特征进行特征融合,基于特征融合结果设计多模态神经网络,进而根据所述多模态神经网络构建识别模型;使用所述识别模型对待识别图像进行识别,并输出识别报告,提升识别的准确性和鲁棒性,更全面地理解图像内容,减少误识别的可能性,提升识别结果的合理性与识别过程的广泛性。
技术关键词
图像识别方法 音频特征 神经网络架构 多模态 合成器 中间层 图像特征向量 文本 数据 生成图像特征 样本 报告 图像处理技术 标签 参数 索引 鲁棒性 标记
系统为您推荐了相关专利信息
1
基于摆动光束及熔池状态在线监测的异种金属激光焊接装置
激光焊接装置 轨迹参数 激光焊接头 高风险 轨迹形状
2
基于人工智能的虚拟人设计与应用平台及方法、设备、介质
多模态 模态特征 长短期记忆网络 时序特征 意图
3
一种基于生成对抗网络和多模态数据的智能数据增强方法、装置及介质
生成对抗网络模型 多模态特征融合 深度卷积神经网络 数据 梅尔频率倒谱系数
4
基于多模态融合的机器视觉情感识别与交互系统及其方法
识别偏差 情绪识别模型 情绪特征 交互方法 多模态情绪
5
一种医疗器械注册证OCR识别系统
识别系统 医疗器械 图像增强单元 文本识别模型 校验模块
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号