摘要
本发明公开的一种金融数据智能录入与验证方法,包括:获取原始文档图像,采用图像增强算法对所述原始文档图像进行处理,得到优化后的文档图像;从所述优化后的文档图像中提取结构化字段,确定字段坐标,生成结构化数据表;对所述结构化数据表中的非标准化文本进行语义解析,生成语义向量表示;根据所述语义向量表示识别缺失字段,查询历史数据库,生成初步填充数据;通过交叉验证机制比对所述初步填充数据与历史数据,得到验证后的字段值;采用分类模型处理所述验证后的字段值,确定文档类型;根据所述文档类型整理所述验证后的字段值,生成标准化数据记录;从所述标准化数据记录中提取关键指标,验证指标逻辑关系,得到修正后的数据。
技术关键词
原始文档图像
验证方法
语义向量
字段
语义结构
预训练语言模型
金融
图像增强算法
数据
分词
生成二值化图像
文本
验证机制
双向长短期记忆
双边滤波算法
依存句法分析
二值化方法
像素亮度值
系统为您推荐了相关专利信息
差异检测技术
云端数据同步
身份验证机制
生成终端
同步算法
语义向量
网页异常检测方法
计算机程序指令
静态网页
超文本标记语言