摘要
本申请公开了一种深度学习模型的显存使用量的预测方法、装置。其中,该方法包括:确定输入深度学习模型的输入序列;获取在深度学习模型以输入序列为输入时,深度学习模型的模型架构中的参数对应的第一显存占用量;获取模型架构对输入序列进行处理时产生的中间激活值对应的第二显存占用量以及深度学习模型中的优化器对输入序列进行处理时产生的第三显存占用量;依据第一显存占用量、第二显存占用量、第三显存占用量确定深度学习模型的显存使用量。本申请解决了相关技术中的方法难以准确预估Transformer模型显存使用量,导致硬件资源配置不合理,从而影响模型运行效率和稳定性的问题的技术问题。
技术关键词
深度学习模型
多头注意力机制
非易失性存储介质
序列
线性变换矩阵
中间层
硬件资源配置
参数
变量
计算机程序产品
预测装置
处理器
模块
存储器
电子设备
系统为您推荐了相关专利信息
多模态数据融合
情感识别方法
客服
多模态数据采集
情感识别模型
鸡毒支原体感染
核酸分子
基因工程技术
细胞系
细胞模型
历史订单数据
管理终端
优化设备
线性规划算法
LSTM算法
分布式方法
动态经济调度
发电机组
数学模型
序列