证件信息提取方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
证件信息提取方法、装置、计算机设备及存储介质
申请号:CN202510906926
申请日期:2025-07-02
公开号:CN120954035A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了证件信息提取方法、装置、计算机设备及存储介质。所述方法包括:获取待处理文档图像;提取所述待处理文档图像的文本元素以及边界框坐标;对所述文本元素及其边界框坐标进行分析,以确定文本元素之间的相对空间位置,推断逻辑结构,并通过插入空格和换行符生成模拟原文档布局的格式化文本;将所述格式化文本输入至大语言模型内,结合提示工程策略,抽取所需的信息,以得到格式化数据;输出所述格式化数据。通过实施本发明的方法可实现显著增强大型语言模型在结构化数据抽取任务中的准确性和效率,以解决现有技术在有效利用纯文本LLM理解文档空间结构方面存在高计算成本、复杂模型修改或数据隐私风险的问题。
技术关键词
信息提取方法 格式化 文本 元素 证件 逻辑 计算机设备 语义结构 大语言模型 布局 坐标 信息提取装置 分析处理单元 图像 数据 校正机制 策略 空间结构 处理器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号