基于大语言模型的证件关键信息提取系统及方法

正文

推荐专利

申请号：CN202410898715

申请日期：2024-07-05

公开号：CN118692097A

公开日期：2024-09-24

类型：发明专利

摘要

本发明公开了基于大语言模型的证件关键信息提取系统及方法，涉及证件数据提取技术领域，包括以下步骤：S1、使用OCR技术从证件图像中获取文本信息，包括文本检测和文本识别；S2、根据获取的文本信息及其在图像中的位置，构建证件信息的表；S3、构造包含少量样本输入输出对的提示词，用于引导大语言模型进行少样本学习；S4、将构造的提示词输入到大语言模型中，以提取证件信息。无需大量标注数据，本方法采用基于大语言模型的few‑shot学习策略，仅需提供少量样本，便能出色地掌握新任务所需的知识，泛化能力出色，具备丰富且强大的自然语言理解能力，适用范围广泛，本方法基于大语言模型的few‑shot学习方式，仅依靠纯文本便能精准提取关键信息。

技术关键词

关键信息提取方法大语言模型信息提取系统证件图像文本识别数据提取技术样本数据处理模块坐标驾驶证自然语言日期身份证护照键值系列格式

系统为您推荐了相关专利信息

一种基于大语言模型的临床试验方案信息分析系统

信息分析系统大语言模型人机交互接口信息展示模块数据获取模块

基于知识图谱增强的大语言模型训练方法及系统

语言模型训练方法语言模型训练系统文本异质知识图谱构建

一种智能客服系统

智能客服系统语义标签画像模型识别客户身份账号

一种面向大语言模型检索增强的上下文冗余优化方法

大语言模型冗余优化方法噪声鲁棒性生成答案生成文本摘要

应答信息生成方法、装置、智能运维系统及电子设备

多源异构数据大语言模型智能运维系统信息生成方法运维场景

基于大语言模型的证件关键信息提取系统及方法

站点导航

APP 下载