一种大语言模型中的推测性解码方法、装置、设备及介质

AITNT
正文
推荐专利
一种大语言模型中的推测性解码方法、装置、设备及介质
申请号:CN202410820882
申请日期:2024-06-24
公开号:CN118734970A
公开日期:2024-10-01
类型:发明专利
摘要
本发明实施例公开了一种大语言模型中的推测性解码方法、装置、设备及介质。该方法包括:在内存中读取历史文本信息,并传输至计算单元;在计算单元中执行:将历史文本信息输入至预设长度预测器,得到推理长度;将推理长度以及历史文本信息输入至预设推测性解码模型,得到与推理长度相同个数的预测文本信息;将历史文本信息输入至大语言模型中,得到大语言模型输出的目标文本信息;将历史文本信息、目标文本信息以及各预测文本信息输入至大语言模型进行验证,得到推理正确的目标预测文本信息;根据历史文本信息与目标预测文本信息进行迭代训练,得到目标长度预测器和目标推测性解码模型。该方法在推测性解码中考虑了推理长度,可提高模型推理性能。
技术关键词
解码模型 大语言模型 解码方法 文本信息传输 编码向量 模型训练模块 可读存储介质 计算机程序产品 解码装置 信息验证 内存 电子设备 处理器通信 网络 存储器
系统为您推荐了相关专利信息
1
基于数据扩展的软件工程智能体构建方法及装置
体构建方法 强化学习方法 大语言模型 离线 数据
2
一种基于加权计算的工单数据智能打标方法
打标方法 数据 指数 列表 大语言模型
3
三维场景图谱中物体节点信息的生成方法及系统
编码向量 节点 生成方法 图谱 场景
4
直播间公屏表情信息交互方法及其装置、设备、介质
信息交互方法 定制界面 入口 身份 自定义表情
5
一种用于大语言模型的提示注入攻击测试用例获得方法
大语言模型 恶意样本 指令 编码器 多轮对话
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号