大模型推理优化方法、装置、计算机设备及介质

AITNT
正文
推荐专利
大模型推理优化方法、装置、计算机设备及介质
申请号:CN202410780029
申请日期:2024-06-17
公开号:CN118607640A
公开日期:2024-09-06
类型:发明专利
摘要
本发明涉及大模型技术领域,公开了大模型推理优化方法、装置、计算机设备及介质,该方法包括:接收当前输入请求,并判断当前输入请求是否存在于端侧缓存中;如果当前输入请求存在于所述端侧缓存中,则确定所述端侧缓存中与当前输入请求对应的输出结果为基于当前输入请求推理计算应得的输出结果;如果当前输入请求不存在于所述端侧缓存中,则利用云端的大模型基于当前输入请求进行推理计算得到相应输出结果,同时将当前输入请求及相应输出结果存储至所述端侧缓存中。可见,本方案能够有效提高输出稳定的同时,一定程度上避免大模型严重重复浪费。
技术关键词
计算机设备 频率 云端 时间段 可读存储介质 优化装置 模型更新 存储器 处理器 指令 通知 模块
系统为您推荐了相关专利信息
1
半导体激光器温度控制方法、存储介质和电子设备
半导体激光器 热电冷却器 加热 热阻 参数
2
面向torus与fat tree融合计算的u2u芯片间互联交换架构、方法
模式切换控制单元 传输待传输数据 芯片 互联交换方法 网格拓扑结构
3
一种防过度摆动的货运物流用物流箱吊装系统
时间段 物流箱 吊装系统 反射点 风速
4
一种直流充电桩远程计量检测方法及其装置
计量检测方法 直流充电桩 计量误差 贝叶斯模型 误差估计值
5
一种服务故障处理方法、装置及相关设备
机器学习模型 异常数据 策略 故障特征 分布式发布订阅消息系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号