基于LLM大小模型协同训练的方法、介质及设备

正文

推荐专利

申请号：CN202510470978

申请日期：2025-04-15

公开号：CN120449937A

公开日期：2025-08-08

类型：发明专利

摘要

本发明公开了一种基于LLM大小模型协同训练的方法、介质及设备，其中方法包括：S1、结合通用大模型的语言理解能力和预训练能力，获得庞大的知识体系，对业务场景所需的AI服务0样本冷启动上线；S2、针对业务场景产生的样本数据进行少量标注并微调通用大模型，形成场景大模型，经不断学习以使场景大模型具备领域内知识，快速提升算法效果；S3、将场景大模型获得的领域内知识蒸馏到多个小模型，利用打分机制对多个小模型的结果进行融合，实现大小模型协同训练。本发明可实现在有限的硬件资源条件下对任一场景文本服务冷启动上线，通过少量标注即可获得大模型知识的大小模型协同训练，大大提高了模型学习能力和工作效率。

技术关键词

答案场景文本数据蒸馏处理器样本标签机制多模型计算机设备算法可读存储介质存储器线性

系统为您推荐了相关专利信息

基于智能手表监测体征数据的医疗重症风险预测方法

风险预测方法多器官系统智能手表疾病风险预测模型

一种燃气器具关键配件寿命评估方法及系统

胶管配件寿命评估方法燃气器具布局仿真模型

基于循环图神经网络的新能源场站发电功率预测方法及系统

发电功率预测方法神经网络模型新能源场站历史气象数据天气预报数据

一种轨道交通的智能运维方法

支持向量机模型决策树模型智能运维方法轨道交通运维机器学习模型

一种AI驱动的战术素养培育系统

培育系统文本特征向量视频分析视频库视频段

基于LLM大小模型协同训练的方法、介质及设备

站点导航

APP 下载