一种基于循环缓存的滑动窗口注意力加速方法及装置

AITNT
正文
推荐专利
一种基于循环缓存的滑动窗口注意力加速方法及装置
申请号:CN202411709463
申请日期:2024-11-27
公开号:CN119204230B
公开日期:2025-02-07
类型:发明专利
摘要
本发明提供一种基于循环缓存的滑动窗口注意力加速方法及装置,解决了现有技术在滑动窗口注意力机制中内存存储效率较低,进而导致大模型对于序列处理速度慢的问题。基于环形缓存机制对含有滑动窗口注意力的大语言模型进行优化,在提高SWA中K Rcache和V Rcache对内存的利用效率的同时,还提高了K Rcache和V Rcache数据存储的速度,进而提升了整个大语言模型的推理速度。
技术关键词
滑动窗口 索引 大语言模型 环形 矩阵 队列 可读存储介质 缓存机制 加速装置 处理器 注意力机制 解码 阶段 参数 数据存储 存储模块 内存
系统为您推荐了相关专利信息
1
环抱型信号域下的声纹识别方法、装置及人机交互设备
声纹识别方法 生理 饱和度 加速度 信号
2
基于大语言模型的企业信息处理方法、装置、设备及存储介质
企业信息处理方法 企业产品信息 大语言模型 页面资源 文档对象模型
3
视频生成模型训练方法、3D场景生成方法及装置
视频生成模型 视频帧特征 场景生成方法 随机噪声 样本
4
一种碟式离心机、系统与方法
碟式离心机 机械密封 环形通道 封盖 灭菌模块
5
智能电网的调度方法、调度装置及计算机程序产品
日用电量 负荷 模糊聚类算法 数据 时间段
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号