摘要
本申请涉及了一种电子图书中的文字识别方法、系统、设备及介质,通过Transformer与CNN的协同工作,同时保留整体结构和细节特征,能够准确分割复杂形状轮廓内的文字区域,消除背景图案对文字识别的干扰。通过形状分割框定精确的识别范围,避免传统方法因文本框定位偏差导致的文字漏检或错误识别,提升电子书插图文字提取的准确率。
技术关键词
文字识别方法
电子图书
矩阵
前馈神经网络
输出特征
卷积神经网络提取
注意力
轮廓
计算机可执行指令
工具检测
可见光图像
文字识别系统
图像转换模块
可读存储介质
多层感知机
控制器
矩形
系统为您推荐了相关专利信息
样本
增广拉格朗日
结构方程模型
阶段
高斯混合模型
呼吸运动预测模型
混合网络模型
补偿方法
位置监测模块
肿瘤
运动状态评估
预测控制算法
精确定位控制
运动特征
探针测试系统