一种基于深度学习模型的图文识别方法及系统

AITNT
正文
推荐专利
一种基于深度学习模型的图文识别方法及系统
申请号:CN202510272164
申请日期:2025-03-10
公开号:CN119785358A
公开日期:2025-04-08
类型:发明专利
摘要
本申请公开了一种基于深度学习模型的图文识别方法及系统,其方法包括:对待测图像进行图像识别,得到文本框区域;获取文本框区域的高度、宽度和长度;基于文本框区域的高度、宽度和长度,确定文本框区域的排序关键字;根据排序关键字对所有文本框区域进行第一次排序;对第一次排序后的文本框区域进行预处理;基于深度学习的OCR模型,对预处理后的文本框区域进行文本识别,得到每个预处理后的文本框区域的识别结果;在识别结果为多个的情况下,计算每个识别结果与预设文本库中的期望文本的相似度,通过相似度确定识别结果;对所有预处理后的文本框区域进行合并,以得到合并后的识别结果。本申请可以有效提高图文识别的准确度。
技术关键词
图文识别方法 深度学习模型 关键字 字典 列表 文本识别 图文识别系统 变量 机器可读存储介质 滤波技术 指令 图像增强 轮廓 存储器 坐标系
系统为您推荐了相关专利信息
1
一种剧院演出舞台设备安全调节控制系统
演出舞台设备 调节控制系统 节点 剧院 规划最优路径
2
一种基于振动信号频率提取算法的方法
频率 信号处理技术 深度学习模型 滤波 监督学习算法
3
文本分块方法、系统、检索增强生成装置、电子设备、存储介质及计算机程序产品
分段 文本分块方法 列表 计算机程序产品 生成装置
4
云烟雾粒子群光传输特性智能仿真系统及其方法
数据接口模块 仿真数据 机器学习模型 模块通信 深度学习模型
5
一种基于FPGA加速的BGP网络流量迁移验证方法
验证方法 确定性状态机 服务质量参数 节点 网络拓扑
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号