端云结合的预测式解码方法、装置、用户端及服务器

AITNT
正文
推荐专利
端云结合的预测式解码方法、装置、用户端及服务器
申请号:CN202410860765
申请日期:2024-06-28
公开号:CN118861232A
公开日期:2024-10-29
类型:发明专利
摘要
本发明提供了一种端云结合的预测式解码方法、装置、用户端及服务器,方法包括:利用第一大语言模型LLM对当前的输入文本进行推理,生成推理词;将所述推理词发送至连接的服务器,以使所述服务器在接收到的推理词数量达到预设阈值后,调用第二大语言模型LLM对接收的所有推理词进行验证,并返回验证结果;其中,所述第二大语言模型LLM的参数量大于所述第一大语言模型LLM的参数量;根据所述验证结果确定当前的输入文本,并更新自身的推理词序列。本发明使用预测式解码的思想,将LLM推理中的一部分计算转移到用户端中,降低了云端的服务器的计算量,从而降低云端的成本,且保持模型的效果同云端模型相同。
技术关键词
预测式解码方法 大语言模型 服务器 序列 文本 自然语言转换 解码装置 处理器通信 云端 存储器 字符 指令 资源
系统为您推荐了相关专利信息
1
一种管理大语言模型中智能体使用场景的系统
大语言模型 上下文管理 插件模块 项目管理工具 匹配模块
2
一种靶向EB病毒gB抗原的单克隆抗体及其应用
单克隆抗体 重组蛋白 诊断EB病毒感染 核酸分子 检测EB病毒
3
一种依据客户安全等级实施差异化交易数据加密方法
数据加密方法 客户 数据保护 加密策略 访问系统
4
一种基于多模态超声的骨骼肌状态评估方法及系统
状态评估方法 超声波检测仪器 隐马尔可夫模型 多模态 参数
5
一种基于NPL分析的患者外出检查智能决策方法及系统
智能决策方法 NLP技术 患者 标签 智能决策系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号