摘要
本申请提供了一种运行在计算平台中的批量矩阵乘法的加速方法。该方法包括:将批量结果矩阵切分为最大数量的任务块,其中,批量结果矩阵包括多个结果矩阵,任一结果矩阵为两个矩阵相乘得到的矩阵;根据最大数量的任务块确定均衡划分策略,其中,均衡划分策略为将多个任务块平均分配到计算平台中的神经网络处理单元NPU的多个计算核的策略;根据均衡划分策略调用计算核中的计算单元,进行所有任务块的矩阵乘法运算,得到批量结果矩阵的计算结果。该方法解决了现有技术中批量矩阵乘法计算方法的计算效率不高的问题。
技术关键词
矩阵乘法运算
神经网络处理单元
批量
策略
矩阵乘法计算方法
可读存储介质
平台
加速装置
计算机
程序
定义
系统为您推荐了相关专利信息
并行策略
机器学习模型
动态规划算法
流水线
搜索模块
数据安全管理系统
数据资产管理
资源分配策略
系统资源消耗
机器学习算法分析
存储方法
中文分词工具
文档分类
模型预训练
文本
销量预测模型
销量数据预测方法
销量预测系统
电商
时间序列特征
驾驶仿真系统
仿真场景
桥接模块
驾驶仿真方法
闭环