摘要
本申请公开了一种基于深度学习模型的图文识别方法及系统,其方法包括:对待测图像进行图像识别,得到文本框区域;获取文本框区域的高度、宽度和长度;基于文本框区域的高度、宽度和长度,确定文本框区域的排序关键字;根据排序关键字对所有文本框区域进行第一次排序;对第一次排序后的文本框区域进行预处理;基于深度学习的OCR模型,对预处理后的文本框区域进行文本识别,得到每个预处理后的文本框区域的识别结果;在识别结果为多个的情况下,计算每个识别结果与预设文本库中的期望文本的相似度,通过相似度确定识别结果;对所有预处理后的文本框区域进行合并,以得到合并后的识别结果。本申请可以有效提高图文识别的准确度。
技术关键词
图文识别方法
深度学习模型
关键字
字典
列表
文本识别
图文识别系统
变量
机器可读存储介质
滤波技术
指令
图像增强
轮廓
存储器
坐标系
系统为您推荐了相关专利信息
演出舞台设备
调节控制系统
节点
剧院
规划最优路径
频率
信号处理技术
深度学习模型
滤波
监督学习算法
分段
文本分块方法
列表
计算机程序产品
生成装置
数据接口模块
仿真数据
机器学习模型
模块通信
深度学习模型
验证方法
确定性状态机
服务质量参数
节点
网络拓扑