摘要
本发明公开了一种基于LLM大小模型协同训练的方法、介质及设备,其中方法包括:S1、结合通用大模型的语言理解能力和预训练能力,获得庞大的知识体系,对业务场景所需的AI服务0样本冷启动上线;S2、针对业务场景产生的样本数据进行少量标注并微调通用大模型,形成场景大模型,经不断学习以使场景大模型具备领域内知识,快速提升算法效果;S3、将场景大模型获得的领域内知识蒸馏到多个小模型,利用打分机制对多个小模型的结果进行融合,实现大小模型协同训练。本发明可实现在有限的硬件资源条件下对任一场景文本服务冷启动上线,通过少量标注即可获得大模型知识的大小模型协同训练,大大提高了模型学习能力和工作效率。
技术关键词
答案
场景
文本
数据
蒸馏
处理器
样本
标签
机制
多模型
计算机设备
算法
可读存储介质
存储器
线性
系统为您推荐了相关专利信息
风险预测方法
多器官系统
智能手表
疾病
风险预测模型
发电功率预测方法
神经网络模型
新能源场站
历史气象数据
天气预报数据
支持向量机模型
决策树模型
智能运维方法
轨道交通运维
机器学习模型