适用于混合专家架构大语言模型的专家访问预测方法和系统

正文

推荐专利

申请号：CN202510101866

申请日期：2025-01-22

公开号：CN120012935B

公开日期：2025-12-26

类型：发明专利

摘要

本发明提供了一种适用于混合专家架构大语言模型的专家访问预测方法和系统，综合考虑模型结构和硬件特征信息，通过为每一层构建基于神经网络的专家访问预测器，并利用历史数据进行训练，能够提前预测模型推理过程中需要激活的专家。这一过程中，预测器在CPU上并行执行预测，而预取器根据预测结果提前将专家参数从主机内存加载到GPU显存中。通过调整预测距离在预测准确率和预取提前量之间进行权衡，并能根据预测准确率动态调整预取数量。同时，采用并行加载，最大化地利用系统资源，减少对GPU推理性能的影响。最后，通过高优先级重新预取等机制来处理预测错误的情况，确保模型推理的正常进行。

技术关键词

大语言模型预测系统内存队列参数模块离线数据主机磁盘动态链路在线平台机制

系统为您推荐了相关专利信息

基于SVM算法的抽水蓄能电站压力钢管脱空缺陷检测方法

SVM算法抽水蓄能电站缺陷检测方法缺陷智能波形

一种用于超表面电磁特性估算的多模态深度学习模型构建方法、介质、设备及应用

深度学习模型构建方法信息数据处理终端训练样本集多模态深度学习表面图案

一种包含可信度因素的中医脑病风险评估数据的分析方法

分析方法中医诊断信息风险评估模型现代医学风险评估技术

一种识别信息的生成方法、装置及相关设备

局部图像特征图像块样本数据生成方法

一种基于数据分析的采购单智能生成决策系统

时间段决策系统联合损失函数元素数据获取模块

适用于混合专家架构大语言模型的专家访问预测方法和系统

站点导航

APP 下载