大模型的推理加速方法、设备及存储介质

AITNT
正文
推荐专利
大模型的推理加速方法、设备及存储介质
申请号:CN202510457550
申请日期:2025-04-11
公开号:CN120525044A
公开日期:2025-08-22
类型:发明专利
摘要
本申请公开了一种大模型的推理加速方法、设备及存储介质,方法包括:将提示信息分别输入至多个不同的小模型中,分别得到每个小模型输出的草稿词元序列;获取每个小模型对应的序列选取数量,分别从每个小模型输出的草稿词元序列中筛选出序列选取数量个草稿词元序列,得到被选中的草稿词元序列;将每个被选中的草稿词元序列输入至大模型进行验证,得到大模型输出的最终词元序列;计算每个小模型对应的正确接收率;基于每个小模型对应的正确接收率,调整每个小模型对应的序列选取数量,可以生成更多的草稿词元序列,且通过正确接收率调整各个小模型的序列选取数量,可以降低无效草稿词元序列造成的计算开销,有效提高大模型的推理速度。
技术关键词
序列 语法模型 场景 周期 可读存储介质 电子设备 处理器 程序 指令 存储器 计算机 数据 参数 样本 速度
系统为您推荐了相关专利信息
1
一种基于神经网络去噪的远同源蛋白质搜索方法、系统、终端及存储介质
搜索方法 列表 隐马尔可夫模型 序列 矩阵
2
一种基于大数据的电商运营实训规划系统及方法
规划系统 策略 仿真模型 大数据 指标
3
一种用于导航或机器人髋臼周围截骨的骨刀集成系统
集成系统 骨刀 髋臼 机器人 反光球
4
网络安全访问控制方法、计算设备、计算机可读存储介质
网络安全访问控制方法 终端设备 网关设备 证书验证 信息验证
5
一种光伏电源用电管理方法
光伏电源 能量分配策略 储能模块 管理方法 光伏发电量
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号