摘要
本申请提供了一种推理过程中的注意力处理方法、装置、设备及介质。应用于大语言模型,该方法包括:利用输入序列得到输入到大语言模型的输入token;从嵌入表中查询得到输入token对应的嵌入向量,并从查询表、键表和值表中分别查询得到输入token对应的查询向量、键向量和值向量;利用输入token对应的嵌入向量、查询向量、键向量和值向量,得到输入token对应的隐向量,隐向量用于推理得到推理结果。本申请能够降低推理成本,提高推理效率。
技术关键词
大语言模型
注意力
热点
计算机程序指令
矩阵
序列
处理器
参数
关系
文本
计算机程序产品
存储器
可读存储介质
电子设备
模块
元素
系统为您推荐了相关专利信息
异常检测方法
电磁声
锂电池
分布式光纤光栅
光纤布拉格光栅反射
水工建筑物
光学图像数据
运动轨迹数据
多尺度特征分析方法
声呐
虚拟计量方法
茶多酚
机器学习模型
茶叶样品
茶红素
阻抗成像方法
正则化算法
误差函数
正则化方法
三角形