摘要
本公开涉及人工智能技术领域,尤其涉及大语言模型的知识蒸馏微调方法、装置、设备及存储介质,方法包括:加载大语言模型,获取训练数据和专家经验函数,构建模板引擎、经验总结器和目标函数,通过目标函数实现经验总结器对专家经验的蒸馏学习,通过对经验总结器训练得到优化编码器,对解码器进行模板式对齐训练得到优化解码器;对由优化编码器和优化解码器组成的大语言模型进行联合对齐训练,得到目标大语言模型;本方案中通过蒸馏学习使大语言模型对输入信息进行多维度处理,可以为用户提供更加个性化和定制化的服务,也可以使模型更加鲁棒,还可以使最终得到的目标大语言模型具备更高的准确性。
技术关键词
大语言模型
微调方法
解码器
编码器
微调机制
蒸馏
文本
微调组件
序列
参数
多头注意力机制
适配器
模板
微调装置
计算机
数据
可读存储介质
人工智能技术
标签
模块
系统为您推荐了相关专利信息
大语言模型
多任务处理方法
数据选择器
多语言
电商
履带摆臂
防倾覆方法
机器人平台
作业机器人
坐标系
移动性预测方法
语义特征
网格
历史轨迹数据
大语言模型
图像生成器
可见光图像
融合特征
边界特征
图像块