用于推测性解码大语言模型的早退方法及计算系统

AITNT
正文
推荐专利
用于推测性解码大语言模型的早退方法及计算系统
申请号:CN202510380236
申请日期:2025-03-28
公开号:CN120633660A
公开日期:2025-09-12
类型:发明专利
摘要
本发明公开了一种用于推测性解码大语言模型的早退方法及计算系统,包括:从大语言模型中选取若干个解码层,在被选中的解码层之后设置预测器;在每次前向过程中,采用草案模型生成语义单元树,大语言模型的输入包括语义单元树中非叶子结点;判断某个被选中的解码层是否早退的过程中:获取所述预测器的输入,当所述预测器根据其输入判断可以早退时;从语义单元树的根节点开始向下搜索满足早退条件的早退路径;若找到满足早退条件的早退路径,则早退并将该早退路径上的各语义单元作为输出。本发明的技术方案将推测解码技术与早退技术相结合,可在精度无损的情况下获得良好的加速效果。
技术关键词
大语言模型 语义 节点 计算机可执行指令 结点 矩阵 解码技术 多层感知机 离线 存储器 在线 处理器 精度
系统为您推荐了相关专利信息
1
一种入侵检测模型构建方法、装置、设备及存储介质
入侵检测模型 服务端 终端 节点 计算机存储介质
2
一种针对设备维修的工业物联网数据隐私计算方法及系统
工业物联网数据 隐私计算方法 信号 故障类别 语义
3
基于5GAeroMACS的机场多模态感知场面监视系统及方法
场面监视系统 多模态 工作模式切换模块 信号 物体
4
一种基于大语言模型的智能外语学习系统
外语学习系统 大语言模型 人机交互设备 状态监控模块 模板
5
一种基于结构化语义关联检索的文本生成方法和装置
文本段落 编码向量 语义相关度 节点 文本生成方法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号