大语言模型的早退加速方法、计算系统及存储介质

AITNT
正文
推荐专利
大语言模型的早退加速方法、计算系统及存储介质
申请号:CN202510380238
申请日期:2025-03-28
公开号:CN120217161A
公开日期:2025-06-27
类型:发明专利
摘要
本发明公开了一种大语言模型的早退加速方法、计算系统及存储介质,该加速方法包括:从大语言模型中选取若干个解码层,在被选中的解码层之后设置分类器;在每次前向过程中,采用草案模型生成多个草稿语义单元,并提取各草稿语义单元在语言模型头中对应的权重;判断某个被选中的解码层是否早退的过程中:根据该解码层输出的隐藏状态、权重以及上一个解码层的概率值计算得到分类器的输入,当分类器判断可以早退时,计算该解码层输出的隐藏状态针对完整词汇表中各语义单元的概率值,如果概率值最高的语义单元在草稿语义单元的集合中,则早退,完成此次前向过程。该方法通过草案模型缩小词汇表空间并优化了分类器效率,加速效果显著。
技术关键词
大语言模型 解码 分类器 语义 多层感知机 计算机可执行指令 可读存储介质 离线 规模 存储器 在线 处理器 参数
系统为您推荐了相关专利信息
1
基于Web应用的AI防护引擎构建方法及系统
HTTP请求 多智能体协同 决策系统 意图 模式匹配
2
一种融合社交的智能体及推荐模拟环境构建方法
环境构建方法 社交 自然语言文本 大语言模型 转移概率矩阵
3
基于多源异构数据语义融合的充电设备故障诊断方法和系统
充电设备 多源异构数据 故障图片 LSTM模型 故障诊断方法
4
一种自进化视频对象信息驱动目标分割框架构建方法
框架构建方法 视觉特征 对象 卷积神经网络提取 特征金字塔网络
5
基于图数据的政策文件修订方法及装置、介质、设备
图谱 关系 修订方法 三元组 自然语言
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号