摘要
本发明提出一种面向低资源短文本分类的大模型蒸馏方法和系统。其中,方法包括:利用同一大模型,根据多步提示方法,建立语义句法增强思维链和领域知识思维链;应用语义句法增强思维链提取短文本中的关键概念,通过关键概念检索短文本的常识知识,根据常识知识输出融合语义和句法推理知识后的改进文本;应用领域知识思维链,提取短文本中的基本概念,通过基本概念,生成领域知识;通过短文本分类任务、改进文本为模型输出的语义与句法推理任务和领域知识为模型输出的领域知识提取任务,对小模型进行训练。本发明提出的方案能够节约硬件资源,适应更多应用场景;提高分类精度,支持无重训练的推理;思维链设计提升推理和涌现能力。
技术关键词
模型蒸馏方法
融合语义
概念
提示方法
文本
节约硬件资源
可读存储介质
蒸馏系统
标签
指令
电子设备
处理器
模块
存储器
计算机
场景
精度
系统为您推荐了相关专利信息
客户端
Gompertz函数
激励方法
中心服务器
联邦学习系统
语义注意力
多头注意力机制
Viterbi解码
文本
上下文特征