摘要
本公开提供了一种多模态大模型分布式训练方法、装置、设备和介质,涉及人工智能和大数据技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域。具体实现方案为:利用加载有待训练大模型的多个设备,对分别输入多个设备的多个训练数据子集各自的样本数据的令牌序列进行切分,得到多个训练数据子集各自的样本数据的多个令牌子序列,不同训练数据子集包含的样本数据的令牌总数量之间的差值小于预定阈值;基于多个训练数据子集各自的样本数据的多个令牌子序列,训练多个设备上加载的待训练大模型,得到目标多模态大模型;其中,各个设备输入一个训练数据子集。
技术关键词
令牌
数据
分布式训练方法
样本
多模态
序列
注意力
输入输出模块
计算机程序产品
计算机视觉
训练装置
处理器通信
指令
可读存储介质
存储器
电子设备
系统为您推荐了相关专利信息
法律知识图谱
周期管理方法
大语言模型
数字水印
动态
评估辅助方法
流媒体服务器
注意力神经网络
人体关键点
视频序列特征提取
数据管控方法
历史数据特征
偏好特征
销售终端
分布式存储技术
UWB测距方法
管理方法
参数检测技术
设备定位技术
节点
营养管理方法
长短期记忆网络
饮食习惯信息
管理控制信息
患者