摘要
本申请公开了计算机技术领域内的一种超大规模文字检测与识别模型训练方法及组件.本申请能够训练得到文字检测与识别模型,该文字检测与识别模型能够检测任一图像中的每个字符的位置及方向,适用于包含文字弯曲,变形或随意分布的文字检测与识别任务,字符检测模型都可以确定字符在图像中的分布位置,从而可实现更细粒度的字符级文字检测和识别.可见本申请提供的字符检测模型针对模板类图像,无规则文字图像都能进行文字检测和提取,模型通用性更佳.相应地,本申请提供的一种包含字符级标注的文字图像数据生成方法,一种基于字符级特征的超大规模文字检测与识别方法及组件,也同样具有上述技术效果。
技术关键词
超大规模
字符检测模型
图像数据生成方法
识别模型训练方法
缩放模块
识别方法
文本行
分辨率
框架
度量
聚类
标签
模板
坐标
动态
弯曲
系统为您推荐了相关专利信息
识别模型训练方法
误差
浓度检测装置
有害气体浓度监测
因子
识别模型训练方法
语言识别方法
分类器
数据
参数
图像文本信息
时间序列分析方法
金字塔网络
通道
上采样