摘要
本发明公开了基于Transformer架构的自动化票据信息处理方法,包括以下步骤:输入票据图像,并进行分块预处理,形成多个图像块;将每个图像块映射到更小的向量空间,然后结合位置信息,形成每个图像块的向量序列;Transformer编码器对每个图像块的向量序列进行两个阶段的特征提取;然后输出向量经过一个额外的线性层;最后通过softmax函数完成对票据文字信息的分类和提取,并根据其输出向量的概率分布选择置信度最高的文字类别作为预测;对序列文字采用递归预测法,直至出现终止符,最后生成完整的票据文字内容。本发明具有针对票据版式多样性的高适应性,能够显著提升处理效率和实时性,且具有较强的模型泛化能力。
技术关键词
票据信息处理方法
前馈神经网络
图像块
编码器
序列
高维特征向量
矩阵
分块
注意力机制
非线性
程序
处理器
服务器
字符
可读存储介质
存储器
系统为您推荐了相关专利信息
分辨率
频谱特征
边界检测技术
原始图像数据
网格
面向网络安全
命令解析方法
网络安全测试
文本
长短期记忆网络
光伏发电预测方法
半监督学习
样本
天气
LSTM模型