基于推测解码评估大模型量化质量的方法、系统、设备

正文

推荐专利

申请号：CN202510714007

申请日期：2025-05-30

公开号：CN120579635A

公开日期：2025-09-02

类型：发明专利

摘要

本申请涉及人工智能技术领域，公开了一种基于推测解码评估大模型量化质量的方法、系统、设备，该方法包括：配置推测解码执行环境，将全精度版本模型设置为主模型，并将至少一个量化版本模型中的一个设置为草稿模型，设置确定性采样参数；向推测解码执行环境提供输入提示词，并驱动主模型和草稿模型执行推测解码过程，以生成输出词元序列；在推测解码过程中，统计由草稿模型生成并被主模型验证通过而接受的词元数量，并计算接受词元数量占草稿模型总生成词元数量的比例，得到词元接受率；基于词元接受率，确定量化版本模型的量化质量。本公开可以快速、客观且对特定量化缺陷进行准确地评估。

技术关键词

解码大语言模型人工智能技术精度计算机参数处理器通信指令比特数模块序列可读存储介质存储器基准电子设备

系统为您推荐了相关专利信息

新能源配置方法、装置、计算机设备、可读存储介质和程序产品

暂态模型站点负荷短路规模

基于全域概率的惯量和虚拟惯量估计方法、装置及设备

虚拟惯量新能源电力系统虚拟同步机估计方法样本

工作流编排方法、执行方法、装置、系统、设备及产品

大语言模型编排方法工作流执行方法关键字工作流执行装置

设备定位方法、装置、物联网设备、存储介质和程序产品

定位算法定位基站设备定位方法蓝牙信标信号到达时间

基于RGB-光流提示指导行为相关因素学习的视频异常检测方法

视频异常检测方法预训练模型编码器解码器架构输入解码器

基于推测解码评估大模型量化质量的方法、系统、设备

站点导航

APP 下载