摘要
本发明提供了一种端云结合的预测式解码方法、装置、用户端及服务器,方法包括:利用第一大语言模型LLM对当前的输入文本进行推理,生成推理词;将所述推理词发送至连接的服务器,以使所述服务器在接收到的推理词数量达到预设阈值后,调用第二大语言模型LLM对接收的所有推理词进行验证,并返回验证结果;其中,所述第二大语言模型LLM的参数量大于所述第一大语言模型LLM的参数量;根据所述验证结果确定当前的输入文本,并更新自身的推理词序列。本发明使用预测式解码的思想,将LLM推理中的一部分计算转移到用户端中,降低了云端的服务器的计算量,从而降低云端的成本,且保持模型的效果同云端模型相同。
技术关键词
预测式解码方法
大语言模型
服务器
序列
文本
自然语言转换
解码装置
处理器通信
云端
存储器
字符
指令
资源
系统为您推荐了相关专利信息
大语言模型
上下文管理
插件模块
项目管理工具
匹配模块
单克隆抗体
重组蛋白
诊断EB病毒感染
核酸分子
检测EB病毒
状态评估方法
超声波检测仪器
隐马尔可夫模型
多模态
参数
智能决策方法
NLP技术
患者
标签
智能决策系统