摘要
本公开提供了用于大模型的存储方法、加载方法、装置、设备、介质,涉及计算机技术领域、人工智能技术领域,尤其涉及大模型、深度学习、计算机视觉、自然语言处理等技术领域。该存储方法的具体实现方案为:根据与多个待存储参数各自对应的初始张量维度和多个待存储参数的属性,得到与多个待存储参数各自对应的存储空间需求;基于存储空间需求和目标存储阈值,对多个待存储参数进行分组,得到多组待存储参数;针对每组待存储参数,分别合并与待存储参数各自对应的张量分片,得到初始张量维度的待存储参数;基于多个存储单元与待存储参数的对应关系,利用多个存储单元各自并行存储初始张量维度的待存储参数。
技术关键词
参数
分布式训练
存储单元
处理单元
分片策略
子模块
存储方法
元素
人工智能技术
计算机程序产品
计算机视觉
处理器通信
自然语言
指令
存储装置
系统为您推荐了相关专利信息
模型部署方法
语句
节点
自定义数据结构
数据平台
智能纸箱
数据分析模块
回收模块
全生命周期数据
管理系统
数字孪生模型
数字孪生方法
游客流量数据
设施
三维建模技术