一种基于深度学习模型的图文识别方法及系统

正文

推荐专利

申请号：CN202510272164

申请日期：2025-03-10

公开号：CN119785358A

公开日期：2025-04-08

类型：发明专利

摘要

本申请公开了一种基于深度学习模型的图文识别方法及系统，其方法包括：对待测图像进行图像识别，得到文本框区域；获取文本框区域的高度、宽度和长度；基于文本框区域的高度、宽度和长度，确定文本框区域的排序关键字；根据排序关键字对所有文本框区域进行第一次排序；对第一次排序后的文本框区域进行预处理；基于深度学习的OCR模型，对预处理后的文本框区域进行文本识别，得到每个预处理后的文本框区域的识别结果；在识别结果为多个的情况下，计算每个识别结果与预设文本库中的期望文本的相似度，通过相似度确定识别结果；对所有预处理后的文本框区域进行合并，以得到合并后的识别结果。本申请可以有效提高图文识别的准确度。

技术关键词

图文识别方法深度学习模型关键字字典列表文本识别图文识别系统变量机器可读存储介质滤波技术指令图像增强轮廓存储器坐标系

系统为您推荐了相关专利信息

一种剧院演出舞台设备安全调节控制系统

演出舞台设备调节控制系统节点剧院规划最优路径

一种基于振动信号频率提取算法的方法

频率信号处理技术深度学习模型滤波监督学习算法

文本分块方法、系统、检索增强生成装置、电子设备、存储介质及计算机程序产品

分段文本分块方法列表计算机程序产品生成装置

云烟雾粒子群光传输特性智能仿真系统及其方法

数据接口模块仿真数据机器学习模型模块通信深度学习模型

一种基于FPGA加速的BGP网络流量迁移验证方法

验证方法确定性状态机服务质量参数节点网络拓扑

一种基于深度学习模型的图文识别方法及系统

站点导航

APP 下载