摘要
本发明提出基于数据特征的动态显存分配方法及系统,涉及数据存储技术领域,方法包括在GP U显存中预分配多个不同大小的显存块,形成三级显存池;实时获取模型输入的数据特征,建立多维特征向量;基于LSTM网络构建时序预测模型,通过输入连续多次推理的特征向量序列,预测显存需求值;根据预测的显存需求值及场景特征矩阵选择分级分配策略;构建显存依赖关系图,动态追踪显存块的最早释放时间,通过复用策略优化显存利用率;监控GPU显存状态指标;根据所述显存状态指标,触发显存优化策略;通过精准预测显存需求、合理分级分配、优化显存利用率及应对不同场景,解决深度学习模型推理中显存管理难题,提升显存使用效率与系统稳定性。
技术关键词
显存分配方法
场景特征
时序预测模型
多维特征向量
马尔可夫链模型
指标
序列
数据依赖关系
池化架构
多头注意力机制
数据存储技术
分块策略
深度学习模型
矩阵
网络
动态更新
系统为您推荐了相关专利信息
商品知识图谱
商品信息查询方法
商品信息查询装置
宽动态
语义
匹配误差
马尔可夫链蒙特卡罗
出力场景
生成系统
概率密度函数
多模态图像数据
云台控制方法
动态照明
多工位协同
运动路径规划