摘要
本发明涉及大模型参数处理领域,公开了一种终端大模型参数协同加载方法、调度方法及系统,包括:根据待加载模型文件确定文件大小,并基于文件大小在推理设备中开辟内存区域,将内存区域起始地址进行字节对齐;获取待加载模型在内存中的缓存情况,并根据缓存情况将待加载模型划分为已缓存区域和未缓存区域;获取推理设备的硬盘加载速度和远内存设备的网络情况,并将未缓存区域划分为硬盘加载区域和远内存加载区域;从推理设备的内存中加载已缓存区域的模型参数到内存区域的相应位置中,从推理设备的硬盘中加载硬盘加载区域的模型参数到内存区域的相应位置中,从远端内存设备中加载远内存加载区域的模型参数到内存区域的相应位置中。
技术关键词
内存设备
硬盘
参数分配方法
页面
终端
算法
线程模型
加载系统
时序
标记
调度系统
速度
处理器通信
模块
网络
指针
存储器
系统为您推荐了相关专利信息
计数器
调光控制电路
LED模拟
乘法器
调节LED电流
硬件资源利用率
数据重删方法
中央处理器
后端磁盘
哈希算法
轮廓数据
三维模型生成方法
渲染服务器
三维模型生成系统
构建算法