摘要
本发明提出了一种基于图像识别的文字提取方法,利用图像采集装置获取文本图像,使用高斯低通滤波算法降噪处理,拉普拉斯算子增强图像的边缘和细节,人工检查并进行旋转调整;文本检测和内容识别分开针对训练,集成识别;强化YOLOv8回归检测头提高预测文本框的精度以及减少模型预测过程中非极大抑制操作提升效率,文本内容识别采用基于Transformer的特征融合扩展模型,通过自身特征扩展和交叉融合扩展方式提升文本识别精度,内容识别模型的训练数据集来自本文区域检测保存的结果;通过CTC损失引入“空”字符的方式对内容识别模型进行训练。本发明可以有效识别文本图像,提高了模型检测速度和精度。
技术关键词
文字提取方法
文本检测模型
文本识别
字符
检测头
拉普拉斯
多头注意力机制
多分支
前馈神经网络
图像采集装置
精度
标签
扩展模块
数据
系统为您推荐了相关专利信息
双分支网络
深度神经网络模型
遥感图像数据
特征描述符
关键点
训练图像数据
编码器
智能检测方法
解码器
多尺度特征
知识点标签
关键帧
分类提取方法
教学
字符识别模型