模型蒸馏方法、答复信息生成方法及装置

AITNT
正文
推荐专利
模型蒸馏方法、答复信息生成方法及装置
申请号:CN202510330312
申请日期:2025-03-19
公开号:CN120218182A
公开日期:2025-06-27
类型:发明专利
摘要
本申请公开了模型蒸馏方法、答复信息生成方法及装置,涉及计算机技术领域,尤其涉及自然语言处理、深度学习、大模型等人工智能领域。具体实现方案为:获取样本问题信息及样本问题信息的样本答复信息;其中,样本答复信息包括样本推理过程信息及样本答案信息;根据样本问题信息,采用初始的小语言模型,获取样本问题信息对应的预测推理过程;其中,初始的小语言模型的模型规模小于大语言模型的模型规模;根据样本问题信息,采用初始的小语言模型,获取样本问题信息的预测答案信息;根据样本推理过程信息、样本答案信息、预测推理过程信息及预测答案信息,对初始的小语言模型进行训练,以获取经训练的小语言模型。
技术关键词
样本 答案 模型蒸馏方法 推理算法 信息生成方法 大语言模型 生成提示信息 模式 复杂度 信息生成装置 规模 信息处理 计算机程序产品 蒸馏装置 处理器通信 模块 自然语言 模板
系统为您推荐了相关专利信息
1
一种基于深度学习的研究生教育数据异常检测方法
异常数据检测 历史采集数据 数据异常检测方法 深度残差神经网络 参数
2
一种智能存取柜的标本管理系统及管理方法
标本管理系统 人脸特征信息 图像 体液 可视化界面
3
光伏电池缺陷检测方法、装置、计算机设备及存储介质
光伏电池缺陷 生成对抗网络 打标签 计算机设备 构建深度学习网络
4
一种跨频协同训练的半监督口腔科影像分割方法
影像分割方法 无监督 标签 学生 医疗图像处理技术
5
基于三角拓扑聚合优化算法优化CNN-BiLSTM-AM模型的锂离子电池健康状态预测方法
三角形 算法 顶点 Pearson相关系数 长短期记忆网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号