一种缓存管理方法、装置、设备、介质和产品

AITNT
正文
推荐专利
一种缓存管理方法、装置、设备、介质和产品
申请号:CN202511517812
申请日期:2025-10-23
公开号:CN120994714A
公开日期:2025-11-21
类型:发明专利
摘要
本发明涉及人工智能技术领域,特别是涉及一种缓存管理方法、装置、设备、介质和产品,方法包括:实时评估不同注意力头对当前推理任务的重要性分值,并根据重要性分值,动态地为每个注意力头的键值缓存分配不同层级的存储资源,包括存储位置和数值精度,从而在保证模型输出质量,尤其是关键信息不丢失的前提下,最大化的节省内存,进而提升推理速度。
技术关键词
缓存管理方法 键值 注意力 层级 分层 模式 指令 精度 缓存管理装置 信息不丢失 可读存储介质 存储计算机程序 序列 人工智能技术 多层感知机 计算机程序产品 处理器 存储模块 矩阵
系统为您推荐了相关专利信息
1
对象推荐方法、装置、电子设备和存储介质
注意力 对象推荐方法 兴趣特征向量 序列 预测特征
2
融合知识蒸馏与稀疏卷积的恶意软件纹理特征分类方法及系统
纹理特征分类 空间金字塔池 随机森林 高效多尺度 分类恶意软件
3
一种数字人数据获取方案及多模态驱动模型训练方法
模型训练方法 音频编码器 生成数字人 音唇同步 视频
4
一种基于卷积网络的无监督行为跟踪识别方法及系统
跟踪识别方法 视频 图像 序列 视觉跟踪技术
5
基于自注意力和强化学习的多无人机目标搜索方法
无人机 搜索方法 策略 注意力机制 贝叶斯推理方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号