大语言模型的早退加速方法、计算系统及存储介质

正文

推荐专利

申请号：CN202510380238

申请日期：2025-03-28

公开号：CN120217161A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开了一种大语言模型的早退加速方法、计算系统及存储介质，该加速方法包括：从大语言模型中选取若干个解码层，在被选中的解码层之后设置分类器；在每次前向过程中，采用草案模型生成多个草稿语义单元，并提取各草稿语义单元在语言模型头中对应的权重；判断某个被选中的解码层是否早退的过程中：根据该解码层输出的隐藏状态、权重以及上一个解码层的概率值计算得到分类器的输入，当分类器判断可以早退时，计算该解码层输出的隐藏状态针对完整词汇表中各语义单元的概率值，如果概率值最高的语义单元在草稿语义单元的集合中，则早退，完成此次前向过程。该方法通过草案模型缩小词汇表空间并优化了分类器效率，加速效果显著。

技术关键词

大语言模型解码分类器语义多层感知机计算机可执行指令可读存储介质离线规模存储器在线处理器参数

系统为您推荐了相关专利信息

基于Web应用的AI防护引擎构建方法及系统

HTTP请求多智能体协同决策系统意图模式匹配

一种融合社交的智能体及推荐模拟环境构建方法

环境构建方法社交自然语言文本大语言模型转移概率矩阵

基于多源异构数据语义融合的充电设备故障诊断方法和系统

充电设备多源异构数据故障图片 LSTM模型故障诊断方法

一种自进化视频对象信息驱动目标分割框架构建方法

框架构建方法视觉特征对象卷积神经网络提取特征金字塔网络

基于图数据的政策文件修订方法及装置、介质、设备

图谱关系修订方法三元组自然语言

大语言模型的早退加速方法、计算系统及存储介质

站点导航

APP 下载