摘要
本申请公开了模型蒸馏方法、答复信息生成方法及装置,涉及计算机技术领域,尤其涉及自然语言处理、深度学习、大模型等人工智能领域。具体实现方案为:获取样本问题信息及样本问题信息的样本答复信息;其中,样本答复信息包括样本推理过程信息及样本答案信息;根据样本问题信息,采用初始的小语言模型,获取样本问题信息对应的预测推理过程;其中,初始的小语言模型的模型规模小于大语言模型的模型规模;根据样本问题信息,采用初始的小语言模型,获取样本问题信息的预测答案信息;根据样本推理过程信息、样本答案信息、预测推理过程信息及预测答案信息,对初始的小语言模型进行训练,以获取经训练的小语言模型。
技术关键词
样本
答案
模型蒸馏方法
推理算法
信息生成方法
大语言模型
生成提示信息
模式
复杂度
信息生成装置
规模
信息处理
计算机程序产品
蒸馏装置
处理器通信
模块
自然语言
模板
系统为您推荐了相关专利信息
异常数据检测
历史采集数据
数据异常检测方法
深度残差神经网络
参数
标本管理系统
人脸特征信息
图像
体液
可视化界面
光伏电池缺陷
生成对抗网络
打标签
计算机设备
构建深度学习网络
影像分割方法
无监督
标签
学生
医疗图像处理技术
三角形
算法
顶点
Pearson相关系数
长短期记忆网络