摘要
本发明公开了证件信息提取方法、装置、计算机设备及存储介质。所述方法包括:获取待处理文档图像;提取所述待处理文档图像的文本元素以及边界框坐标;对所述文本元素及其边界框坐标进行分析,以确定文本元素之间的相对空间位置,推断逻辑结构,并通过插入空格和换行符生成模拟原文档布局的格式化文本;将所述格式化文本输入至大语言模型内,结合提示工程策略,抽取所需的信息,以得到格式化数据;输出所述格式化数据。通过实施本发明的方法可实现显著增强大型语言模型在结构化数据抽取任务中的准确性和效率,以解决现有技术在有效利用纯文本LLM理解文档空间结构方面存在高计算成本、复杂模型修改或数据隐私风险的问题。
技术关键词
信息提取方法
格式化
文本
元素
证件
逻辑
计算机设备
语义结构
大语言模型
布局
坐标
信息提取装置
分析处理单元
图像
数据
校正机制
策略
空间结构
处理器