摘要
本发明涉及人工智能技术领域,提供一种模型性能优化方法、电子设备、存储介质和程序产品,其中方法包括:基于模型结构,获取每个模型层对应的计算操作以及模型层之间的通信操作;将所有计算操作和通信操作组织成多个计算通信并行单元,每个单元包括第一矩阵乘累加操作、融合归约操作和第二矩阵乘累加操作;在每个单元内,对输入数据进行切分,以使第一矩阵乘累加操作、融合归约操作和第二矩阵乘累加操作基于不同的数据块并行执行。本发明通过将所有计算操作和通信操作组织成多个计算通信并行单元,并在每个单元内对数据进行切分,实现了计算操作与通信操作的并行执行,提高了并行度以及计算资源和硬件资源的利用率,从而显著提升了模型性能。
技术关键词
性能优化方法
矩阵
网络模块
内核
非暂态计算机可读存储介质
数据
电子设备
处理器
分块
人工智能技术
计算机程序产品
注意力
组织
信号值
存储器
系统为您推荐了相关专利信息
识别岩石
神经网络模型
识别方法
样本
人工智能深度学习
数据采集节点
决策优化方法
多源融合
灌溉决策系统
因子
双随机
情感分类方法
矩阵
计算机程序产品
特征数据库