摘要
本发明公开了基于大语言模型的证件关键信息提取系统及方法,涉及证件数据提取技术领域,包括以下步骤:S1、使用OCR技术从证件图像中获取文本信息,包括文本检测和文本识别;S2、根据获取的文本信息及其在图像中的位置,构建证件信息的表;S3、构造包含少量样本输入输出对的提示词,用于引导大语言模型进行少样本学习;S4、将构造的提示词输入到大语言模型中,以提取证件信息。无需大量标注数据,本方法采用基于大语言模型的few‑shot学习策略,仅需提供少量样本,便能出色地掌握新任务所需的知识,泛化能力出色,具备丰富且强大的自然语言理解能力,适用范围广泛,本方法基于大语言模型的few‑shot学习方式,仅依靠纯文本便能精准提取关键信息。
技术关键词
关键信息提取方法
大语言模型
信息提取系统
证件图像
文本识别
数据提取技术
样本
数据处理模块
坐标
驾驶证
自然语言
日期
身份证
护照
键值
系列
格式
系统为您推荐了相关专利信息
信息分析系统
大语言模型
人机交互接口
信息展示模块
数据获取模块
语言模型训练方法
语言模型训练系统
文本
异质
知识图谱构建
智能客服系统
语义标签
画像模型
识别客户身份
账号
大语言模型
冗余优化方法
噪声鲁棒性
生成答案
生成文本摘要
多源异构数据
大语言模型
智能运维系统
信息生成方法
运维场景