模型推理方法、装置、电子设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510858161

申请日期：2025-06-25

公开号：CN120975221A

公开日期：2025-11-18

类型：发明专利

摘要

本申请提供一种模型推理方法、装置、电子设备、存储介质及程序产品。该方法包括：通过大语言模型，采用第一数值精度对已推理tokens进行注意力计算，获得每个已推理token对应的第一注意力分数；基于第一注意力分数从已推理tokens中筛选目标tokens；通过大语言模型，采用第二数值精度对输入序列进行推理，获得大语言模型输出的推理结果；输入序列包括目标tokens和待推理token对应的待输入tokens；待输入tokens为根据预设规则从已推理tokens中预选取的tokens；第一数值精度低于第二数值精度。本申请采用混合精度计算实现了token的稀疏化处理，从而提高了大语言模型的推理效率。

技术关键词

大语言模型注意力数值精度推理方法计算机程序指令序列强化学习算法信息熵电子设备推理装置处理器计算机程序产品存储器模块

系统为您推荐了相关专利信息

一种妇科宫颈图像增强处理方法

宫颈彩色图像妇科红外图像特征图像块

语音流处理方法、深度学习模型的训练方法、装置及智能体

样本融合特征深度学习模型序列语音特征提取

一种基于散热模型优化的被动散热结构PLC控制器的控制方法

被动散热结构 PLC控制器高精度传感器综合评估模型故障案例库

增强鲁棒性的基于多帧漏磁信号分析的管道目标识别方法

信号分析识别方法鲁棒性分类特征检测损失

一种膝关节应力分布计算方法、装置、设备及存储介质

膝关节应力生成式对抗网络机器学习模型分布计算方法

模型推理方法、装置、电子设备、存储介质及程序产品

站点导航

APP 下载