摘要
本发明提供一种基于人工智能纠正OCR的财会单据数据汇总方法,属于财会单据数据汇总技术领域,本发明首先通过光照均衡化处理并计算褶皱度和污渍可读度等参数对单据图像进行预处理,然后利用OCR引擎进行初步识别获取原始文本数据。核心创新在于构建了基于Vision Transformer架构的财务感知自校正模型,该模型通过双流注意力网络整合视觉和文本特征,并引入质量影响门控函数动态调整注意力分布,实现对不同质量区域的差异化校正。结合扫描质量补偿函数和财务领域知识图谱验证,大幅提高了复杂质量条件下财会单据数据识别的准确率和效率。
技术关键词
数据汇总方法
财会
单据
视觉特征提取
财务
图像
文本
褶皱特征
数据汇总技术
直方图均衡化算法
参数
校正
层次注意力
注意力机制
识别置信度
分布直方图
褶皱区域
系统为您推荐了相关专利信息
政务
知识图谱构建方法
实体
半结构化文本数据
特征量化方法
大语言模型
RPA方法
自然语言
财务
前端技术栈
多模态信息融合
操作控制方法
生成反馈信号
控制执行器
末端执行器
财务管理系统
构建预测模型
数据采集模块
分析模块
分析财务数据