摘要
本申请公开了一种基于深度学习的弯曲文本检测与识别方法及系统,属于人工智能与计算机视觉技术领域,包括:分别搭建文本检测模型和文本识别模型;分别对所述文本检测模型和所述文本识别模型进行训练,对应获得训练好的文本检测模型和训练好的文本识别模型;基于训练好的文本检测模型对文本区域进行位置标记,以生成标记结果;基于训练好的文本识别模型对文本内容进行识别提取,以生成识别结果;基于所述标记结果和所述识别结果生成文本内容。本发明提出了一种融合特征增强与图像矫正的深度学习模型,包括文本检测模型和文本识别模型,显著提升了复杂场景下,弯曲文本的定位与内容提取能力。
技术关键词
文本检测模型
文本识别模型
卷积特征
识别方法
注意力机制
生成文本内容
生成多尺度
融合特征
矫正
弯曲
标记
图像块
色彩校正
模块
计算机视觉技术
图片
矩阵
系统为您推荐了相关专利信息
风险检测方法
序列
漏洞
训练样本数据
风险检测装置
油耗
车辆状态数据
异常识别方法
机器学习模型
训练集
姿态识别模型
哺乳母猪
生成感兴趣区域
拼接融合方法
姿态识别方法
框架构建方法
问答模型
问答系统
深度特征提取
个性化信息推荐
AI深度学习
碳纳米管
生长控制方法
参数
锂离子电池