基于动量机制与多类型专家的低能耗大语言模型的数据处理方法和系统

正文

推荐专利

申请号：CN202510898422

申请日期：2025-07-01

公开号：CN120450054B

公开日期：2025-08-29

类型：发明专利

摘要

本申请公开了基于动量机制与多类型专家的低能耗大语言模型的数据处理方法和系统，属于大语言模型技术领域，包括获取混合专家模型，混合专家模型包括门控网络、组合网络和多个专家网络；基于懒加载机制获取目标数据；通过门控网络获取目标数据对应各个专家网络的适应度得分，获取满足排序要求的专家网络为目标网络；获取目标数据在目标网络中的输出数据，并通过组合网络加权求和多个输出数据。本申请在混合专家模型中设置多个专家网络，通过对目标数据的适应度得分进行适应度排名，选取满足排名要求的专家网络的输出进行加权求和，以获得最终输出，降低浮点运算和计算内存开销，提高计算效率，减少内存资源浪费。

技术关键词

大语言模型数据处理方法分布式训练节点负载均衡机制网络单元非线性数据处理系统多层感知器样本矩阵动态因子优化器内存分词策略

系统为您推荐了相关专利信息

基于机器视觉的工业物品外观检测方法及系统

物品外观灰度共生矩阵直方图均衡化分布式架构多源信息融合

一种异常确定方法、装置、电子设备、存储介质和程序产品

统一数据模型异常数据异常事件基础对象

答复文本推荐方法及装置、电子设备、存储介质

嵌入特征偏好特征文本推荐方法实体关系提取对象

大语言模型的服务请求调度方法、介质、设备及程序产品

大语言模型序列请求调度方法机器学习技术存储装置

一种架空输电线路碳排放智能监测分析方法

监测分析方法排放智能节点数字孪生大数据聚类分析

基于动量机制与多类型专家的低能耗大语言模型的数据处理方法和系统

站点导航

APP 下载