基于字符级特征的超大规模文字检测与识别方法

AITNT
正文
推荐专利
基于字符级特征的超大规模文字检测与识别方法
申请号:CN202510044104
申请日期:2025-01-10
公开号:CN119942551A
公开日期:2025-05-06
类型:发明专利
摘要
本申请公开了计算机技术领域内的一种超大规模文字检测与识别模型训练方法及组件.本申请能够训练得到文字检测与识别模型,该文字检测与识别模型能够检测任一图像中的每个字符的位置及方向,适用于包含文字弯曲,变形或随意分布的文字检测与识别任务,字符检测模型都可以确定字符在图像中的分布位置,从而可实现更细粒度的字符级文字检测和识别.可见本申请提供的字符检测模型针对模板类图像,无规则文字图像都能进行文字检测和提取,模型通用性更佳.相应地,本申请提供的一种包含字符级标注的文字图像数据生成方法,一种基于字符级特征的超大规模文字检测与识别方法及组件,也同样具有上述技术效果。
技术关键词
超大规模 字符检测模型 图像数据生成方法 识别模型训练方法 缩放模块 识别方法 文本行 分辨率 框架 度量 聚类 标签 模板 坐标 动态 弯曲
系统为您推荐了相关专利信息
1
有害气体浓度识别模型训练方法、装置和系统及监测方法
识别模型训练方法 误差 浓度检测装置 有害气体浓度监测 因子
2
多语言识别模型训练方法、语言识别方法和电子设备
识别模型训练方法 语言识别方法 分类器 数据 参数
3
一种基于多对角块矩阵分解的电源网络结构弱点检测方法
矩阵 网络结构 计算机程序指令 节点 多核处理器
4
基于统计分析和图像识别的财务报表自动化处理方法
图像文本信息 时间序列分析方法 金字塔网络 通道 上采样
5
一种内容感知和追踪的方法、装置、电子设备和存储介质
视频帧 切片 尺寸 识别神经网络 元素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号