摘要
本发明公开了一种基于整体语义特征提取的中文文字识别方法,采用Encoder‑Decoder架构,包括对输入图像进行预处理;预处理后的输入图像通过卷积神经网络进行特征提取和降采样,获取输入图像包含不同深度层次的局部特征图;特征融合:利用不同深度的Transformer Block提取局部特征图中不同层次的特征向量,将局部特征图及不同层次的特征向量在通道维度上进行拼接,形成拼接后的的特征向量;解码:使用Transformer Decoder对拼接后的特征向量进行自回归解码,生成识别结果。本方法在中文文字识别任务中具有高效性、准确性和适应性,满足了多样化的识别需求,具有很高的实用价值和推广潜力。
技术关键词
中文文字识别方法
语义特征提取
局部注意力机制
多头注意力机制
解码
图像
卷积模块
字符
通道
线性
编辑
文本
策略
序列