摘要
本发明公开了一种用于面向少数民族文献文字识别的方法、装置、工作介质及计算机设备。该方法包括以下步骤:S1、收集并标注少数民族文献文字图像样本,对图像进行预处理,构成数据集;S2、构建注意力机制增强的神经网络模型,神经网络模型包括依次连接的输入层、共享特征提取模块、注意力机制增强的特征融合模块和输出层;S3、采用多任务学习训练注意力机制对神经网络模型进行练,以对神经网络模型进行优化;S4、部署优化后的神经网络模型,以对少数民族文献图像进行文字区域检测和几何属性预测,得到少数民族文献文字检测识别结果。本发明同时利用图像特征和几何特征进行预测,提高了水书文献的检测精度。
技术关键词
神经网络模型
注意力机制
特征提取模块
训练注意力
图像
计算机设备
文字识别装置
多任务
执行存储器存储
文本
样本
通道
后处理模块
多尺度
数据处理模块
处理器
残差网络
系统为您推荐了相关专利信息
水冷系统
RBF神经网络
温度传感器
温度监测系统
高铁牵引系统
语义变化检测方法
遥感影像数据
语义特征
高分辨率光学遥感图像
多尺度特征融合
决策支持系统
智能化运维
设备运行状态
数据采集层
数据质量检查
智能理解技术
遥感图像数据
闭环方法
意图
推理技术