一种混合文本图像的检测识别方法及装置

AITNT
正文
推荐专利
一种混合文本图像的检测识别方法及装置
申请号:CN202411052045
申请日期:2024-08-01
公开号:CN119131800A
公开日期:2024-12-13
类型:发明专利
摘要
本发明提出的一种混合文本图像的检测识别方法及装置,所述方法包括:收集原始图片集,构建数据集,并进行数据集预处理;基于卷积网络分类器、CRAFT检测模型和TROCR识别模型,利用数据集进行模型训练,生成光学字符识别模型;获取数据集中的测试集,利用光学字符识别模型对测试集进行文本检测和类型识别;对测试集进行图片提升处理;基于类型识别结果,利用光学字符识别模型对处理后的测试集进行文本识别,生成识别结果;对识别结果进行融合,生成融合后的识别结果;利用多重筛选法优化融合后的识别结果,生成唯一的文本识别结果;将唯一的文本识别结果与对应的文本图片内容进行比对,计算并统计光学字符识别模型的识别准确率。
技术关键词
光学字符识别 检测识别方法 文本识别 图片 图像 分类器 卷积神经网络结构 训练集 序列 检测识别装置 递归神经网络 边缘检测算法 矫正 数据分类 坐标 格式化
系统为您推荐了相关专利信息
1
一种道路损害检测方法及系统
金字塔池化模块 多层感知机 可执行程序指令 通道注意力机制 特征提取模块
2
矿井的安全隐患识别方法、装置及系统
图像特征数据 采集设备 识别方法 迁移学习模型 佩戴安全帽
3
基于典型相关分析的对比学习音视频情绪识别方法
情绪识别方法 模块 图像 网络 LBP特征
4
基于双分支编码器的遥感图像阴影检测方法与系统
图像阴影检测方法 阴影检测模型 分支 神经网络结构 编码器模块
5
基于云平台的定制化产品数据管理系统及方法
定制化产品 编码向量 数据管理方法 云平台 图像特征提取
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号