一种人工智能模型加速训练推理方法及装置

正文

推荐专利

一种人工智能模型加速训练推理方法及装置

申请号：CN202510369523

申请日期：2025-03-27

公开号：CN119884575B

公开日期：2025-08-19

类型：发明专利

摘要

本发明提供一种人工智能模型加速训练推理方法及装置，属于人工智能领域，本发明首先利用叠层分组技术将人工智能模型中大维度矩阵进行分组拆解，转化为叠层分块矩阵结构；然后利用ACA‑SVD矩阵分解技术将非对角块矩阵进行压缩分解，表示为两个小矩阵相乘；然后将得到的叠层分块矩阵结构的对角矩阵块依次提取出来，将矩阵表示为多个块对角矩阵相乘，分别存储各个块对角矩阵；当进行模型训练和推理时，矩阵相乘过程可以转化成多个块对角矩阵相乘，矩阵求逆过程可以转化成多个块对角矩阵的求逆，各个块对角矩阵相互独立，运算过程中不存在递归关系，可以实现高度并行运算。

技术关键词

块对角矩阵人工智能模型叠层矩阵分解技术分块推理方法模型训练模块协方差矩阵矩阵求逆运算复杂度存储模块推理装置自然语言算法关系精度语音资源

系统为您推荐了相关专利信息

基于资源预估和预计算策略的多标量乘法加速方法

标量乘法多分辨率缓存命中率资源适配机制桶策略

针对航空的复合材料检查系统和方法

复合材料部件超声检查设备人工智能模型计算机断层扫描数据处理装置

一种软硬件结合的内存访问模式分析方法及装置

模式分析方法硬件平台内存访问模式分析工具硬件计数器

一种面向ARM架构的对称密码加解密方法及系统

加解密方法变量加解密系统密钥非线性组件

一种避免图片分块渲染合成出现边界线的创新方法

分块图片分布式存储系统渲染算法像素

一种人工智能模型加速训练推理方法及装置

站点导航

APP 下载