一种基于大规模数据的大模型分布训练方法及装置

正文

推荐专利

申请号：CN202510228831

申请日期：2025-02-28

公开号：CN120163188A

公开日期：2025-06-17

类型：发明专利

摘要

本申请提供了一种基于大规模数据的大模型分布训练方法及装置，所述方法包括：获取待训练大模型；将待训练大模型拆分为多个子模型，并分别部署到多个计算机设备上，每个子模型包含若干连续的神经网络层；获取大规模样本数据；基于大规模样本数据，连接所述计算机设备，实现待训练大模型的模型训练。本申请中，通过将大模型进行拆分，分别部署到不同计算机设备的方式，从而降低每个计算机设备的计算复杂度，大大降低模型训练的设备内存要求和性能要求。

技术关键词

计算机设备分片链路加密设备样本浮点数更新模型参数模型训练模块并行技术数据获取模块训练装置存储器处理器可读存储介质程序流水线核心复杂度电子设备

系统为您推荐了相关专利信息

一种用于能耗预测的边端协同AI模型构建系统及方法

协方差矩阵模型构建方法模型构建系统参数传感器

语音合成方法、装置、计算机设备及存储介质

语音识别模型编码向量计算机可读指令文本编码器频谱特征

基于GA-BP神经网络的L型板钩吊装强度预测方法

强度预测方法 BP神经网络遗传算法优化神经网络模型应力

客户投诉概率的预测方法、装置、设备及存储介质

多任务分类客户分类预测模型音色特征数据

音频降噪方法、装置、电子设备和存储介质

多模态语义特征音频降噪方法音频特征数据

一种基于大规模数据的大模型分布训练方法及装置

站点导航

APP 下载