基于数据特征的动态显存分配方法及系统

AITNT
正文
推荐专利
基于数据特征的动态显存分配方法及系统
申请号:CN202510374248
申请日期:2025-03-27
公开号:CN120315866B
公开日期:2025-10-03
类型:发明专利
摘要
本发明提出基于数据特征的动态显存分配方法及系统,涉及数据存储技术领域,方法包括在GP U显存中预分配多个不同大小的显存块,形成三级显存池;实时获取模型输入的数据特征,建立多维特征向量;基于LSTM网络构建时序预测模型,通过输入连续多次推理的特征向量序列,预测显存需求值;根据预测的显存需求值及场景特征矩阵选择分级分配策略;构建显存依赖关系图,动态追踪显存块的最早释放时间,通过复用策略优化显存利用率;监控GPU显存状态指标;根据所述显存状态指标,触发显存优化策略;通过精准预测显存需求、合理分级分配、优化显存利用率及应对不同场景,解决深度学习模型推理中显存管理难题,提升显存使用效率与系统稳定性。
技术关键词
显存分配方法 场景特征 时序预测模型 多维特征向量 马尔可夫链模型 指标 序列 数据依赖关系 池化架构 多头注意力机制 数据存储技术 分块策略 深度学习模型 矩阵 网络 动态更新
系统为您推荐了相关专利信息
1
基于知识图谱的商品信息查询方法及相关设备
商品知识图谱 商品信息查询方法 商品信息查询装置 宽动态 语义
2
基于数据驱动的新能源联合出力场景生成系统及方法
匹配误差 马尔可夫链蒙特卡罗 出力场景 生成系统 概率密度函数
3
一种基于机器学习的土石坝变形快速预测方法及系统
数据 时序预测模型 样本 绘图模块 时序演化规律
4
一种多工位云台控制方法及装置
多模态图像数据 云台控制方法 动态照明 多工位协同 运动路径规划
5
基于自然语言处理的视频剧情生成与场景合成方法及系统
语义特征 视频 场景结构 语义相关度 序列
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号