大模型参数的调度方法、推理方法、装置及电子设备

AITNT
正文
推荐专利
大模型参数的调度方法、推理方法、装置及电子设备
申请号:CN202510448733
申请日期:2025-04-10
公开号:CN120448054A
公开日期:2025-08-08
类型:发明专利
摘要
本申请提供一种大模型参数的调度方法、推理方法、装置及电子设备。方法包括:获取当前层transformer模块的输入特征;输入特征为上一层transformer模块输出的特征;通过当前层transformer模块对应的参数预测模型对输入特征进行分析,获得下一层transformer模块推理所需的目标专家模型;基于目标专家模型判断需要调度目标模型参数,则生成参数调度策略;根据参数调度策略将目标专家模型的目标模型参数从CPU内存调度至GPU内存。本申请通过参数预测模型获得下一层transformer模块推理所需的目标专家模型,并将目标模型参数从CPU调度到GPU,减少了对GPU内存的占用。
技术关键词
缓存调度策略 内存 键值 模块 非暂态计算机可读存储介质 动态随机存取存储器 生成参数 推理方法 计算机程序指令 中央处理器 图像处理器 输出特征 强化学习算法 高带宽 电子设备 推理装置 图形处理器
系统为您推荐了相关专利信息
1
图像处理方法、图像重建模型生成方法、装置、计算机设备、可读存储介质和程序产品
图像重建 样本 训练神经网络模型 模型生成方法 场景
2
焊接或涂胶工艺缺陷视觉验证实验平台
缺陷视觉 视觉验证系统 模拟实验装置 识别算法 高分辨率摄像头
3
一种实时大数据流处理与异常检测系统
异常检测系统 隐私保护模块 分布式流 数据采集模块 智能适配器
4
压下工艺对连铸方坯宏观偏析影响的预测的方法
热力耦合模型 连铸方坯 液相 表达式 铸坯表面
5
工业移动终端的控制方法、装置、工业移动终端及存储介质
模组 关键点特征 工业 随机森林模型 POGO连接器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号