一种基于知识蒸馏与思维链的轻量化信息抽取方法及系统

AITNT
正文
推荐专利
一种基于知识蒸馏与思维链的轻量化信息抽取方法及系统
申请号:CN202411932410
申请日期:2024-12-26
公开号:CN120011533A
公开日期:2025-05-16
类型:发明专利
摘要
本发明公开了一种基于知识蒸馏与思维链的轻量化信息抽取方法及系统,涉及自然语言处理中的信息抽取技术领域,包括:首先,对领域文本进行预处理,利用少样本学习进行数据增强,生成伪数据以提高模型在特定领域的表现;随后,通过大语言模型进行微调,提取文本中的实体、关系和事件和推理中间结果等关键信息;接着,应用知识蒸馏技术,将微调后的大模型知识压缩至轻量化模型中。同时采用检索增强生成技术和思维链机制,结合实时查询外部知识库,精确地从文本中提取结构化信息,逐步完成复杂信息提取任务。本发明提升了信息抽取的准确性和模型的轻量化部署效果,适用于命名实体识别、关系抽取、事件检测和情感分析等多种任务。
技术关键词
信息抽取方法 预训练语言模型 文本 数据 教师 信息抽取系统 信息抽取技术 知识蒸馏技术 学生 终端设备 命名实体识别 样本 大语言模型 生成技术 计算机 标签 自然语言 关系 定义
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号