一种基于大规模数据的大模型分布训练方法及装置

AITNT
正文
推荐专利
一种基于大规模数据的大模型分布训练方法及装置
申请号:CN202510228831
申请日期:2025-02-28
公开号:CN120163188A
公开日期:2025-06-17
类型:发明专利
摘要
本申请提供了一种基于大规模数据的大模型分布训练方法及装置,所述方法包括:获取待训练大模型;将待训练大模型拆分为多个子模型,并分别部署到多个计算机设备上,每个子模型包含若干连续的神经网络层;获取大规模样本数据;基于大规模样本数据,连接所述计算机设备,实现待训练大模型的模型训练。本申请中,通过将大模型进行拆分,分别部署到不同计算机设备的方式,从而降低每个计算机设备的计算复杂度,大大降低模型训练的设备内存要求和性能要求。
技术关键词
计算机设备 分片 链路 加密设备 样本 浮点数 更新模型参数 模型训练模块 并行技术 数据获取模块 训练装置 存储器 处理器 可读存储介质 程序 流水线 核心 复杂度 电子设备
系统为您推荐了相关专利信息
1
一种用于能耗预测的边端协同AI模型构建系统及方法
协方差矩阵 模型构建方法 模型构建系统 参数 传感器
2
语音合成方法、装置、计算机设备及存储介质
语音识别模型 编码向量 计算机可读指令 文本编码器 频谱特征
3
基于GA-BP神经网络的L型板钩吊装强度预测方法
强度预测方法 BP神经网络 遗传算法 优化神经网络模型 应力
4
客户投诉概率的预测方法、装置、设备及存储介质
多任务分类 客户 分类预测模型 音色特征 数据
5
音频降噪方法、装置、电子设备和存储介质
多模态 语义特征 音频降噪方法 音频特征 数据
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号