摘要
本发明涉及一种针对端侧的大语言模型快速生成令牌的方法,属于大语言模型技术领域,包括:获取输入文本;将输入文本输入预训练的快速生成令牌模型中,快速生成令牌模型包括大语言模型和自投机解码模块;大语言模型根据输入文本生成隐藏状态向量,根据隐藏状态向量生成初始令牌,自投机解码模块根据隐藏状态向量生成多个候选令牌,根据初始令牌和候选令牌构建树结构;通过大语言模型对树结构中的每条路径进行验证;大语言模型根据验证结果更新隐藏状态向量,并根据新的隐藏状态向量生成新的初始令牌,自投机解码模块根据新的隐藏状态向量生成新的候选令牌,以循环迭代,直至达到终止条件后,将验证结果合格的路径中的令牌作为最终输出。
技术关键词
令牌
大语言模型
解码模块
构建树结构
文本
奇异值分解方法
收集训练数据
蒸馏方法
处理器
输入模块
输出模块
存储器
矩阵
节点
电子设备
分词
算法
程序
系统为您推荐了相关专利信息
排序模型
问答模型
数据记录集合
答案
文本处理方法
供热系统管网
异常事件
异常检测方法
大语言模型
数据