摘要
本申请涉及一种基于Tensor Core处理向量算子的方法、装置和计算机设备,涉及人工智能技术领域,方法包括通过在接收到向量算子,且确定向量算子长度为预设值整数倍时,将向量算子转换为N×M的待运算矩阵;N和M均为k的整数倍,预设值为k2;基于向量算子的运算需求,调用元素个数为预设值整数倍的匹配运算矩阵;匹配运算矩阵左乘待运算矩阵得到待确定矩阵;待确定矩阵左乘匹配运算矩阵得到目标矩阵,确定目标矩阵中的任一元素为向量算子的运算需求的结果值;通过对待运算向量算子的简单变换,实现Tensor Core对非矩阵运算进行运算处理,有利于提升GPU资源的利用率。
技术关键词
矩阵
元素
计算机设备
数据转换模块
人工智能技术
计算机程序产品
处理器
输出模块
可读存储介质
存储器
资源