一种大模型训练加速方法、装置、设备及存储介质

正文

推荐专利

申请号：CN202510483660

申请日期：2025-04-17

公开号：CN120276680A

公开日期：2025-07-08

类型：发明专利

摘要

本申请公开了一种大模型训练加速方法、装置、设备及存储介质，涉及人工智能领域，包括：确定各目标数据块对应的访问频率以确定目标数据块是否为目标类型数据；目标类型数据对应的访问频率高于其他类型数据对应的访问频率，且目标类型数据的数据块大小小于预设数据块大小阈值；若目标数据块是目标类型数据，则将目标数据块缓存至预设内存空间中，以便从预设内存空间中对目标数据块进行读取以训练目标大模型；若不是目标类型数据，则将目标数据块缓存至预设磁盘空间中，并利用缓存管理工具对缓存在预设磁盘空间中的目标数据块进行管理，以便从预设磁盘空间中读取目标数据块以训练目标大模型。本申请实现了对大模型训练过程的加速。

技术关键词

GPU服务器管理工具远程存储节点数据压缩算法缓存系统频率分布式一致性协议应用程序编程接口数据访问模式历史访问记录数据分类加速装置格式可读存储介质处理器电子设备模块

系统为您推荐了相关专利信息

基于私有联盟链的服务授权方法、装置及电子设备

服务授权方法节点私有云环境非易失性存储介质加密设备

一种基于逻辑编排的轻应用构建方法

逻辑渲染结构残差注意力机制节点序列

卫星对地观测路径规划方法、装置、设备及存储介质

网格路径规划方法轨道幅宽节点

一种基于动态哈希编码的神经辐射场渲染方法

动态场景颜色层级坐标冲突检测机制

一种电池组BMS控制功率分配方法及系统

电池单元矩阵功率分配方法电池组子系统

一种大模型训练加速方法、装置、设备及存储介质

站点导航

APP 下载