模型推理方法、计算机程序产品及芯片

AITNT
正文
推荐专利
模型推理方法、计算机程序产品及芯片
申请号:CN202510323473
申请日期:2025-03-18
公开号:CN120197702A
公开日期:2025-06-24
类型:发明专利
摘要
本申请实施例提供一种模型推理方法、计算机程序产品及芯片。在模型推理过程中,可以存储每个词元在每一层的隐藏状态,在需要用到这些词元的键值缓存时,可以基于该隐藏状态和键值投影权重矩阵恢复每个词元在模型每一层的键值缓存。本申请实施例提供的键值缓存恢复方案,可以同时以较低的开销利用芯片的计算资源和数据传输带宽资源,而不是单一的使用一种资源实现键值缓存的恢复,可以大大提高键值缓存的恢复效率,进而,提高模型的推理效率。
技术关键词
键值 存储单元 策略 计算机程序产品 位置编码信息 推理方法 芯片 内存访问技术 文本 索引表 序列 矩阵恢复 数据 可读存储介质 处理器 存储器 标识
系统为您推荐了相关专利信息
1
用于变电站的设备巡检方法、装置和非易失性存储介质
巡检机器人 巡检项目 设备巡检方法 非易失性存储介质 检测仪器
2
一种基于联邦学习的量子安全数据处理方法及其系统
客户端 密钥 集群 加解密单元 数据处理方法
3
一种融合强化学习与图神经网络的成矿因果发现方法
变量 随机森林模型 计算机可读指令 建模误差 编码器
4
一种云际分布式缓存数据库自适应调优方法及系统
监控指标数据 调优方法 结构方程模型 计算机执行指令 参数
5
一种基于CNN图像识别的CAN总线攻击入侵检测方法
入侵检测方法 归一化方法 集成策略 彩色图像 车载CAN网络
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号