基于大语言模型的证件关键信息提取系统及方法

AITNT
正文
推荐专利
基于大语言模型的证件关键信息提取系统及方法
申请号:CN202410898715
申请日期:2024-07-05
公开号:CN118692097A
公开日期:2024-09-24
类型:发明专利
摘要
本发明公开了基于大语言模型的证件关键信息提取系统及方法,涉及证件数据提取技术领域,包括以下步骤:S1、使用OCR技术从证件图像中获取文本信息,包括文本检测和文本识别;S2、根据获取的文本信息及其在图像中的位置,构建证件信息的表;S3、构造包含少量样本输入输出对的提示词,用于引导大语言模型进行少样本学习;S4、将构造的提示词输入到大语言模型中,以提取证件信息。无需大量标注数据,本方法采用基于大语言模型的few‑shot学习策略,仅需提供少量样本,便能出色地掌握新任务所需的知识,泛化能力出色,具备丰富且强大的自然语言理解能力,适用范围广泛,本方法基于大语言模型的few‑shot学习方式,仅依靠纯文本便能精准提取关键信息。
技术关键词
关键信息提取方法 大语言模型 信息提取系统 证件图像 文本识别 数据提取技术 样本 数据处理模块 坐标 驾驶证 自然语言 日期 身份证 护照 键值 系列 格式
系统为您推荐了相关专利信息
1
一种基于大语言模型的临床试验方案信息分析系统
信息分析系统 大语言模型 人机交互接口 信息展示模块 数据获取模块
2
基于知识图谱增强的大语言模型训练方法及系统
语言模型训练方法 语言模型训练系统 文本 异质 知识图谱构建
3
一种智能客服系统
智能客服系统 语义标签 画像模型 识别客户身份 账号
4
一种面向大语言模型检索增强的上下文冗余优化方法
大语言模型 冗余优化方法 噪声鲁棒性 生成答案 生成文本摘要
5
应答信息生成方法、装置、智能运维系统及电子设备
多源异构数据 大语言模型 智能运维系统 信息生成方法 运维场景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号