大语言模型的内存管理方法及装置

AITNT
正文
推荐专利
大语言模型的内存管理方法及装置
申请号:CN202510111389
申请日期:2025-01-23
公开号:CN119576805B
公开日期:2025-07-11
类型:发明专利
摘要
本申请实施例提供了一种大语言模型的内存管理方法及装置,其中,该方法包括:获取输入词元,其中,输入词元是大语言模型处理的基本单元;通过大语言模型,对输入词元进行推理处理,得到第一长度的键值缓存,其中,第一长度的键值缓存是输入词元需删除的词元对应的键值缓存;在第一长度小于第二长度的情况下,设置目标内存管理块存储第一长度的键值缓存,其中,第二长度是目标内存管理块允许存储键值缓存的最大长度;在第一长度等于第二长度的情况下,设置目标内存管理块取消存储第一长度的键值缓存。通过本申请,解决了大语言模型的内存管理稳定性较低的问题,进而达到了提高大语言模型的内存管理稳定性的效果。
技术关键词
键值 大语言模型 内存管理方法 新词 阶段 可读存储介质 处理器 解码 存储器 计算机 电子设备 精度 参数 数据
系统为您推荐了相关专利信息
1
一种用于水下机器人的多模态人机交互控制方法及系统
水下机器人 人机交互控制方法 手势动作指令 波束 意图
2
一种机电工程施工信息管理方法、系统及介质
动态贝叶斯网络 机电工程施工 信息管理方法 贝叶斯网络模型 时间片
3
基于k8s进行模型训练的方法
敏感度矩阵 队列 节点 阶段 资源
4
基于少样本学习的图像分类方法、装置、设备及存储介质
图像分类方法 原型 视觉特征 图像编码器 图片
5
退役动力电池的多目标双边拆解线平衡方法及装置
退役动力电池 线平衡装置 进化算法 平衡方法 关系
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号