深度学习模型的显存使用量的预测方法、装置

AITNT
正文
推荐专利
深度学习模型的显存使用量的预测方法、装置
申请号:CN202510728857
申请日期:2025-05-30
公开号:CN120631572A
公开日期:2025-09-12
类型:发明专利
摘要
本申请公开了一种深度学习模型的显存使用量的预测方法、装置。其中,该方法包括:确定输入深度学习模型的输入序列;获取在深度学习模型以输入序列为输入时,深度学习模型的模型架构中的参数对应的第一显存占用量;获取模型架构对输入序列进行处理时产生的中间激活值对应的第二显存占用量以及深度学习模型中的优化器对输入序列进行处理时产生的第三显存占用量;依据第一显存占用量、第二显存占用量、第三显存占用量确定深度学习模型的显存使用量。本申请解决了相关技术中的方法难以准确预估Transformer模型显存使用量,导致硬件资源配置不合理,从而影响模型运行效率和稳定性的问题的技术问题。
技术关键词
深度学习模型 多头注意力机制 非易失性存储介质 序列 线性变换矩阵 中间层 硬件资源配置 参数 变量 计算机程序产品 预测装置 处理器 模块 存储器 电子设备
系统为您推荐了相关专利信息
1
一种基于多模态数据融合的客服人员情感识别方法及系统
多模态数据融合 情感识别方法 客服 多模态数据采集 情感识别模型
2
鸡蛋白激酶JNK1在抗鸡毒支原体感染中的应用
鸡毒支原体感染 核酸分子 基因工程技术 细胞系 细胞模型
3
快递最佳频次优化方法、装置、设备及存储介质
历史订单数据 管理终端 优化设备 线性规划算法 LSTM算法
4
一种基于柯西收敛序列的电力系统动态经济调度分布式方法
分布式方法 动态经济调度 发电机组 数学模型 序列
5
一种基于视觉技术的操场直线跑道标定的方法、装置、设备及介质
迭代优化算法 跑道 直线 异常点 方程
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号