生成式对话模型推理方法、设备、介质及计算机程序产品

正文

推荐专利

申请号：CN202410854061

申请日期：2024-06-28

公开号：CN118394919B

公开日期：2024-08-20

类型：发明专利

摘要

本发明公开了一种生成式对话模型推理方法、设备、介质及计算机程序产品，涉及人工智能技术领域，包括：根据生成式对话模型的模型结构确定出键矩阵和值矩阵的各个输出位置；基于输出位置对生成式对话模型进行分割，得到分割后的多个模型块，并对每一模型块输出的键矩阵和值矩形作为中间状态值进行保存；将各模型块部署至目标芯片，并在目标芯片上按照生成式对话模型的先后分割顺序依次对各模型块进行推理，直到满足预设停止条件；推理过程包括：将目标相邻模型块中的前一模型块的推理结果与对应中间状态值的叠加结果作为下一模型块的输入；目标相邻模型块包括任一次循环推理过程中的最后一个模型块和下一次循环推理过程中的第一个模型块。

技术关键词

模型块推理方法缓存技术矩阵芯片计算机程序产品键值矩形存储计算机程序人工智能技术队列处理器硬盘内存可读存储介质电子设备指令备份主机

系统为您推荐了相关专利信息

一种光伏配电网的谐波优化方法及系统

谐波优化方法序列标志功率因数光伏配电网技术

玻璃双磨边机压力自适应控制系统及方法

玻璃磨边磨边机压力控制系统指标

一种基于U-net与线框分析网络的拓扑优化结构后处理方法及系统

拓扑优化结构后处理方法神经网络模型线框孔洞

一种基于PSO参数寻优的四维混沌系统图像加密方法

四维混沌系统 Lyapunov指数图像加密方法四阶龙格混沌系统模型

一种智能植物和钉螺调查样方框装置及调查方法

调查样方框智能植物调查方法激光投影器样方调查

生成式对话模型推理方法、设备、介质及计算机程序产品

站点导航

APP 下载