摘要
本发明提出的一种混合文本图像的检测识别方法及装置,所述方法包括:收集原始图片集,构建数据集,并进行数据集预处理;基于卷积网络分类器、CRAFT检测模型和TROCR识别模型,利用数据集进行模型训练,生成光学字符识别模型;获取数据集中的测试集,利用光学字符识别模型对测试集进行文本检测和类型识别;对测试集进行图片提升处理;基于类型识别结果,利用光学字符识别模型对处理后的测试集进行文本识别,生成识别结果;对识别结果进行融合,生成融合后的识别结果;利用多重筛选法优化融合后的识别结果,生成唯一的文本识别结果;将唯一的文本识别结果与对应的文本图片内容进行比对,计算并统计光学字符识别模型的识别准确率。
技术关键词
光学字符识别
检测识别方法
文本识别
图片
图像
分类器
卷积神经网络结构
训练集
序列
检测识别装置
递归神经网络
边缘检测算法
矫正
数据分类
坐标
格式化
系统为您推荐了相关专利信息
金字塔池化模块
多层感知机
可执行程序指令
通道注意力机制
特征提取模块
图像特征数据
采集设备
识别方法
迁移学习模型
佩戴安全帽
图像阴影检测方法
阴影检测模型
分支
神经网络结构
编码器模块
定制化产品
编码向量
数据管理方法
云平台
图像特征提取