一种基于图像识别的文字提取方法

AITNT
正文
推荐专利
一种基于图像识别的文字提取方法
申请号:CN202411445926
申请日期:2024-10-16
公开号:CN119672722A
公开日期:2025-03-21
类型:发明专利
摘要
本发明提出了一种基于图像识别的文字提取方法,利用图像采集装置获取文本图像,使用高斯低通滤波算法降噪处理,拉普拉斯算子增强图像的边缘和细节,人工检查并进行旋转调整;文本检测和内容识别分开针对训练,集成识别;强化YOLOv8回归检测头提高预测文本框的精度以及减少模型预测过程中非极大抑制操作提升效率,文本内容识别采用基于Transformer的特征融合扩展模型,通过自身特征扩展和交叉融合扩展方式提升文本识别精度,内容识别模型的训练数据集来自本文区域检测保存的结果;通过CTC损失引入“空”字符的方式对内容识别模型进行训练。本发明可以有效识别文本图像,提高了模型检测速度和精度。
技术关键词
文字提取方法 文本检测模型 文本识别 字符 检测头 拉普拉斯 多头注意力机制 多分支 前馈神经网络 图像采集装置 精度 标签 扩展模块 数据
系统为您推荐了相关专利信息
1
数据处理方法、装置、设备、存储介质及产品
数据处理方法 协议 国际漫游技术 邮件 坐标
2
基于双分支网络架构的多模态遥感图像关键点检测方法
双分支网络 深度神经网络模型 遥感图像数据 特征描述符 关键点
3
基于稀疏DETR模型的SAR图像目标智能检测方法
训练图像数据 编码器 智能检测方法 解码器 多尺度特征
4
面向中医药垂直领域的大模型构建方法及装置
中医药 模型构建方法 数据 教科书 模型构建装置
5
网络教学视频知识点分类提取方法、装置、设备及介质
知识点标签 关键帧 分类提取方法 教学 字符识别模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号