摘要
本申请实施例提供一种基于大模型的银行数据文件解析方法及系统,通过获取待解析银行数据文件集合;对待解析银行数据文件集合中的每个待解析银行数据文件执行文件格式识别操作,确定每个待解析银行数据文件的文件格式类型;根据文件格式类型对每个待解析银行数据文件进行信息提取操作,得到可编辑文本格式的待解析银行数据文件对应的文本格式标准化数据、和/或、图像扫描格式的待解析银行数据文件对应的图像格式标准化数据;将文本格式标准化数据、和/或、图像格式标准化数据进行数据字段对齐处理,合并为统一结构的银行数据结构化集合,并存储银行数据结构化集合,从而提高银行数据文件解析的效率和准确性。
技术关键词
数据记录集合
表格
数据处理模型
文本
解析方法
表头
图像
页面
校验数据序列
元素
分布特征
坐标
字符
格式
数据字
编辑
多尺度特征融合
融合特征