端云结合的预测式解码方法、装置、用户端及服务器

正文

推荐专利

申请号：CN202410860765

申请日期：2024-06-28

公开号：CN118861232A

公开日期：2024-10-29

类型：发明专利

摘要

本发明提供了一种端云结合的预测式解码方法、装置、用户端及服务器，方法包括：利用第一大语言模型LLM对当前的输入文本进行推理，生成推理词；将所述推理词发送至连接的服务器，以使所述服务器在接收到的推理词数量达到预设阈值后，调用第二大语言模型LLM对接收的所有推理词进行验证，并返回验证结果；其中，所述第二大语言模型LLM的参数量大于所述第一大语言模型LLM的参数量；根据所述验证结果确定当前的输入文本，并更新自身的推理词序列。本发明使用预测式解码的思想，将LLM推理中的一部分计算转移到用户端中，降低了云端的服务器的计算量，从而降低云端的成本，且保持模型的效果同云端模型相同。

技术关键词

预测式解码方法大语言模型服务器序列文本自然语言转换解码装置处理器通信云端存储器字符指令资源

系统为您推荐了相关专利信息

一种管理大语言模型中智能体使用场景的系统

大语言模型上下文管理插件模块项目管理工具匹配模块

一种靶向EB病毒gB抗原的单克隆抗体及其应用

单克隆抗体重组蛋白诊断EB病毒感染核酸分子检测EB病毒

一种依据客户安全等级实施差异化交易数据加密方法

数据加密方法客户数据保护加密策略访问系统

一种基于多模态超声的骨骼肌状态评估方法及系统

状态评估方法超声波检测仪器隐马尔可夫模型多模态参数

一种基于NPL分析的患者外出检查智能决策方法及系统

智能决策方法 NLP技术患者标签智能决策系统

端云结合的预测式解码方法、装置、用户端及服务器

站点导航

APP 下载