模型推理方法、装置、设备、介质和程序产品

AITNT
正文
推荐专利
模型推理方法、装置、设备、介质和程序产品
申请号:CN202410806956
申请日期:2024-06-20
公开号:CN118586503A
公开日期:2024-09-03
类型:发明专利
摘要
本发明提供一种模型推理方法、装置、设备、介质和程序产品,所述方法包括:获取当前场景下的当前输入;基于推理模型,从缓存加载当前输入对应的历史键值矩阵以及当前输入对应的目标键值矩阵进行推理,得到当前输入对应的当前推理结果;其中,目标键值矩阵是从推理模型对目标场景下的基础任务进行批次推理生成的基础键值矩阵中选取的,目标场景包含当前场景。本发明提供的模型推理方法、装置、设备、介质和程序产品,采用较小的额外推理代价实现对未接触过的领域任务进行准确且快速推理。
技术关键词
推理方法 键值 矩阵 场景 基础 预训练模型 分块 推理装置 处理器 计算机程序产品 介质 存储器 电子设备 元素
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号