摘要
本发明公开了一种基于知识蒸馏与思维链的轻量化信息抽取方法及系统,涉及自然语言处理中的信息抽取技术领域,包括:首先,对领域文本进行预处理,利用少样本学习进行数据增强,生成伪数据以提高模型在特定领域的表现;随后,通过大语言模型进行微调,提取文本中的实体、关系和事件和推理中间结果等关键信息;接着,应用知识蒸馏技术,将微调后的大模型知识压缩至轻量化模型中。同时采用检索增强生成技术和思维链机制,结合实时查询外部知识库,精确地从文本中提取结构化信息,逐步完成复杂信息提取任务。本发明提升了信息抽取的准确性和模型的轻量化部署效果,适用于命名实体识别、关系抽取、事件检测和情感分析等多种任务。
技术关键词
信息抽取方法
预训练语言模型
文本
数据
教师
信息抽取系统
信息抽取技术
知识蒸馏技术
学生
终端设备
命名实体识别
样本
大语言模型
生成技术
计算机
标签
自然语言
关系
定义