摘要
本公开提供一种大语言模型推理方法、装置、计算机设备及存储介质,属于人工智能技术领域。本公开的大语言模型推理方法包括:根据令牌序列请求,查询本级缓存中存储的令牌序列;若本级缓存中存储的令牌序列被命中,则返回缓存结果;若本级缓存中存储的令牌序列未被命中,则查询下一级缓存;若各级缓存中存储的令牌序列均未被命中,则生成推理结果;将推理结果写入各级缓存,并返回推理结果。
技术关键词
令牌
推理方法
大语言模型
序列
推理装置
计算机设备
处理器
可读存储介质
人工智能技术
速率
存储器
控制模块
程序
频率
策略
缓冲
接口
系统为您推荐了相关专利信息
文本特征向量
语音生成方法
声学特征
文本编码器
序列
饱和度
智能手表
时间序列分析技术
陀螺仪数据
机器学习算法