摘要
本发明公开了一种基于多模态子模型特征感知的自适应张量并行方法,该方法首先通过模型算子的采样数据从计算、通信两个维度构建多模态模型代价评估模型,评估张量策略的代价开销,并基于计算和通信代价对张量并行策略进行分析,通过粗粒度张量切分算法搜索张量并行策略。其次将子模型的计算图G1对应子模型中的算子融合到子模型的计算图G2对应子模型中,利用G2对应子模型的计算时间差与通信空隙执行G1对应子模型的训练,优化通过粗粒度张量切分算法搜索得到的张量并行策略中设备间的负载不均衡,得到最终的最优张量并行策略。本发明提升算子的计算效率并降低算子间的通信开销,优化设备间负载不均衡的问题。
技术关键词
并行策略
多模态
并行方法
融合策略
优化设备
算法
节点
时间差
跨设备
规模
空隙
注意力
代表
序列
切片
数据
系统为您推荐了相关专利信息
深度强化学习
交叉注意力机制
策略
编码模块
EDF算法
仿真模型
数字孪生模型
仿真数据
闭环反馈机制
仿真环境
多语言
视觉
多模态数据采集
映射算法
生成对抗网络
编队方法
水流
多模态传感器
长短期记忆网络
惯性导航单元