终端大模型参数协同加载方法、调度方法及系统

AITNT
正文
推荐专利
终端大模型参数协同加载方法、调度方法及系统
申请号:CN202510607163
申请日期:2025-05-13
公开号:CN120144490B
公开日期:2025-09-12
类型:发明专利
摘要
本发明涉及大模型参数处理领域,公开了一种终端大模型参数协同加载方法、调度方法及系统,包括:根据待加载模型文件确定文件大小,并基于文件大小在推理设备中开辟内存区域,将内存区域起始地址进行字节对齐;获取待加载模型在内存中的缓存情况,并根据缓存情况将待加载模型划分为已缓存区域和未缓存区域;获取推理设备的硬盘加载速度和远内存设备的网络情况,并将未缓存区域划分为硬盘加载区域和远内存加载区域;从推理设备的内存中加载已缓存区域的模型参数到内存区域的相应位置中,从推理设备的硬盘中加载硬盘加载区域的模型参数到内存区域的相应位置中,从远端内存设备中加载远内存加载区域的模型参数到内存区域的相应位置中。
技术关键词
内存设备 硬盘 参数分配方法 页面 终端 算法 线程模型 加载系统 时序 标记 调度系统 速度 处理器通信 模块 网络 指针 存储器
系统为您推荐了相关专利信息
1
一种电网装备供应链的绩效评价方法和系统
供应链系统 绩效评价方法 仓库 节点 订单
2
LED模拟调光控制电路
计数器 调光控制电路 LED模拟 乘法器 调节LED电流
3
一种数据重删方法、装置、设备及介质
硬件资源利用率 数据重删方法 中央处理器 后端磁盘 哈希算法
4
一种三维模型生成方法、系统及装置
轮廓数据 三维模型生成方法 渲染服务器 三维模型生成系统 构建算法
5
一种电缆终端场避雷器端部电压相位的解算方法
电缆终端场 避雷器阻性电流 变电站 电压 线路
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号