摘要
本发明公开了基于CRNN与改进CTC的RPA自动化票据信息处理系统,包括票据数据预处理单元、数据解析单元和数据自动录入单元;票据数据预处理单元,利用卷积神经网络提取票据图像的卷积特征;卷积特征被编码成特征向量序列;由双向长短期记忆网络作为循环层,进一步学习特征向量序列,并初步预测出特征向量序列标签的概率分布矩阵;数据解析单元,采用加入了注意力机制的CTC将概率分布矩阵解码为具体的文本标签;数据自动录入单元利用RPA将数据解析单元得到的最终识别结果自动录入到业务系统中。本发明利用深度学习技术的强大特征提取和序列建模能力,结合RPA的自动化处理优势,实现票据信息的高效率、高准确性识别。
技术关键词
双向长短期记忆网络
票据
信息处理系统
卷积特征
解析单元
序列
矩阵
注意力机制
图像
关键视觉信息
Softmax函数
卷积神经网络提取
数据
业务系统
标签
深度学习技术
解码
空间结构
编码
索引