摘要
本公开提供了多模态混合专家模型训练及任务数据处理方法和装置,涉及深度学习、大模型以及自然语言处理等人工智能领域。其中的多模态混合专家模型训练方法可包括:获取多模态的原始训练数据;对原始训练数据进行数据优化处理,得到多模态混合专家模型对应的目标训练数据;根据目标训练数据,采用预定并行方式对多模态混合专家模型进行训练,所述预定并行方式包括:数据并行方式和模型并行方式。
技术关键词
多模态
文本
数据处理方法
流水线
模型训练方法
模型训练模块
音频
数据处理模块
图像
参数
模型训练装置
处理器
数据处理装置
阶段
指令
计算机程序产品
视频
标识
系统为您推荐了相关专利信息
文本特征向量
注意力参数
预训练语言模型
非暂态计算机可读存储介质
矩阵
局部放电智能
特高频电磁波信号
设备端
诊断系统
超声波检测模块
信息标识生成方法
语义
数据标识生成方法
查询类别
跨模态
简历筛选方法
注意力机制
动态
语义
强化学习模型
数据清洗方法
指令
模板
数据清洗技术
数据清洗装置