摘要
本申请提供一种大模型参数的调度方法、推理方法、装置及电子设备。方法包括:获取当前层transformer模块的输入特征;输入特征为上一层transformer模块输出的特征;通过当前层transformer模块对应的参数预测模型对输入特征进行分析,获得下一层transformer模块推理所需的目标专家模型;基于目标专家模型判断需要调度目标模型参数,则生成参数调度策略;根据参数调度策略将目标专家模型的目标模型参数从CPU内存调度至GPU内存。本申请通过参数预测模型获得下一层transformer模块推理所需的目标专家模型,并将目标模型参数从CPU调度到GPU,减少了对GPU内存的占用。
技术关键词
缓存调度策略
内存
键值
模块
非暂态计算机可读存储介质
动态随机存取存储器
生成参数
推理方法
计算机程序指令
中央处理器
图像处理器
输出特征
强化学习算法
高带宽
电子设备
推理装置
图形处理器
系统为您推荐了相关专利信息
图像重建
样本
训练神经网络模型
模型生成方法
场景
缺陷视觉
视觉验证系统
模拟实验装置
识别算法
高分辨率摄像头
异常检测系统
隐私保护模块
分布式流
数据采集模块
智能适配器
模组
关键点特征
工业
随机森林模型
POGO连接器