一种基于transformer模型的GPU推理性能优化方法、系统、设备及存储介质

正文

推荐专利

申请号：CN202411963194

申请日期：2024-12-30

公开号：CN119886347A

公开日期：2025-04-25

类型：发明专利

摘要

本发明公开一种基于transformer模型的GPU推理性能优化方法、系统、设备及存储介质，该性能优化方法为通用的transformer模型推理性能调优策略，适用于多种应用场景和模型类型，通过自定义算子替换和融合，实现对Attention算子、LayerNorm算子、GBR算子、GB算子等的优化，显著减少计算量或内存的使用，提升模型性能，具体的优化步骤包括迭代搜索、模式匹配、算子替换和融合，提升深度学习模型的训练速度和推理速度，且降低资源消耗和成本。

技术关键词

性能优化方法自定义算子模式匹配性能优化系统模块通信接口深度学习模型存储计算机程序存储器处理器数据电子设备脚本内存速度策略场景芯片平台

系统为您推荐了相关专利信息

一种中医具身机器人情志辩证交互系统及方法

深度强化学习语音声学特征交互系统机器人面部

车载传感器的标定参数校验方法、系统、介质及设备

车载传感器参数校验方法点云轨迹 ICP算法坐标系

煤炭开采数据管理系统及方法

三维模型数据管理方法数据管理系统定位器煤炭

一种机房环境下的语音降噪识别方法及装置

噪声功率谱语音识别模型音频识别方法机房环境

一种车载影像标定方法、装置、设备和存储介质

坐标系视角矩阵计算机程序代码标定方法

一种基于transformer模型的GPU推理性能优化方法、系统、设备及存储介质

站点导航

APP 下载