摘要
本申请公开了一种大模型推理方法、装置、相关设备及计算机程序产品,涉及人工智能领域,本申请先获取待处理问题的问题陈述,而后在大模型基于问题陈述进行链式推理过程中,依据当前推理节点的输入token判断当前节点是否为关键节点,若不是,则对前节点的原始输出token进行压缩处理,基于压缩处理结果推理后续节点。本申请先对推理节点关键与否进行了判定,而后在进行后续推理时压缩非关键推理节点的输出token,减少了后续推理过程所需处理的输入数据量,加快了后续处理速度,有助于优化链式推理,特别是长链式推理的计算效率。
技术关键词
推理方法
节点
注意力
生成规则
联合损失函数
计算机程序产品
符号
矩阵
阶段
推理装置
置信度阈值
编码
处理器
数值
字典
可读存储介质
存储器
复杂度
序列
电子设备
系统为您推荐了相关专利信息
视觉分析方法
融合特征
知识图谱库
视觉分析系统
高弹性材料
SRv6数据包
心跳包发送方法
终端
控制器
分段
嵌入特征
多尺度特征提取
特征提取模块
矩阵
积层
消化道内窥镜图像
辅助检测方法
超分辨率
高清
生成对抗网络