数据处理方法、装置、电子设备及存储介质

正文

推荐专利

数据处理方法、装置、电子设备及存储介质

申请号：CN202411844781

申请日期：2024-12-13

公开号：CN119940474A

公开日期：2025-05-06

类型：发明专利

摘要

本公开提供了一种数据处理方法、装置、电子设备及存储介质，涉及深度学习技术领域，具体涉及分布式大模型训练优化技术领域。具体实现方案为：获取当前训练模型对应的原始检查点文件，原始检查点文件包括权重参数和优化器状态参数；将原始检查点文件中的优化器状态参数进行切分，以得到第一检查点文件；将新增权重参数加入第一检查点文件，以及将与新增权重参数对应的优化器状态参数按照参数个数切分合并到第一检查点文件，得到第二检查点文件，以通过第二检查点文件中的参数进行热启训练。本公开显著增强了模型处理多模态数据的能力，同时避免了从头开始训练所带来的时间和资源消耗，提升了模型训练的连续性和模型性能的稳定性。

技术关键词

检查点文件优化器参数数据处理方法深度学习技术电子设备模块总量数据处理装置计算机程序产品处理器通信指令可读存储介质多模态存储器连续性资源

系统为您推荐了相关专利信息

一种行人步态的识别模型训练方法、识别方法及装置

识别模型训练方法关键点行人步态检测图像标签

一种基于Locati法的齿轮疲劳强度快速试验方法

齿轮性能预测模型正态分布函数应力齿面粗糙度

一种基于两步法的VTI介质各向异性参数反演方法

参数反演方法全波形反演 VTI介质更新模型参数代表

一种在太赫兹波段下的超音速目标RCS特性的提取方法

等离子体鞘套乘波体仿真模型等离子鞘套软件

基于多模态数据融合的呼吸节律推荐方法及相关装置

多模态数据融合心率推荐方法功率值策略梯度强化学习

数据处理方法、装置、电子设备及存储介质

站点导航

APP 下载