基于混合专家模型的任务处理方法、装置及存储介质

正文

推荐专利

申请号：CN202411366857

申请日期：2024-09-29

公开号：CN119292579A

公开日期：2025-01-10

类型：发明专利

摘要

本发明公开了一种基于混合专家模型的任务处理方法、装置及存储介质，其中方法包括：将自编程任务划分为五类任务，其中，五类任务包括函数名和语法预测任务、变量名预测任务、字符串参数预测任务、基座模型预测任务和文风预测任务；对于每一类任务，基于标注后的示例代码训练得到每一类任务对应的LoRA专家模型；基于训练好的专家调度器，根据当前自编程任务的任务类型，联合多个LoRA专家模型进行推理得到任务代码。本发明通过将自编程任务划分为五类任务，每类任务对应一个LoRA专家模型，多个LoRA专家模型共用一个基座多语言模型，对自编程任务进行推理，能够有效降低显存需求，从而能够有效提高专家模型处理的效率。

技术关键词

调度器推理网络编程转换器模块模型训练模块数据大语言模型样本可读存储介质计算机基座多语言处理器终端设备存储器策略参数注意力非线性

系统为您推荐了相关专利信息

一种电价预测方法、装置、设备、存储介质及产品

电价预测方法矩阵深度学习模型模型训练模块归一化方法

一种空中移动充电机器人及使用方法

移动充电机器人跑车轴向驱动机构充电舱锂电池模块

汽车压铸件图像的异常检测方法、装置、设备及存储介质

汽车压铸件图像异常检测方法特征提取模块特征提取单元

基于物联网的低温耦合热泵远程监控与数据采集系统

耦合热泵数据采集系统云端服务器子模块数据传输组件

一种疾病模型巨噬细胞在体编程的方法

转录因子条形码条码疾病动物模型编程

基于混合专家模型的任务处理方法、装置及存储介质

站点导航

APP 下载