一种应答信息生成方法、设备、介质及计算机程序产品

正文

推荐专利

申请号：CN202510387245

申请日期：2025-03-31

公开号：CN119884332B

公开日期：2025-07-22

类型：发明专利

摘要

本发明公开了一种应答信息生成方法、设备、介质及计算机程序产品，涉及人工智能技术领域，针对预训练语言模型的并行推理计算的一个批次中，根据所在设备执行预填充任务的算力利用率确定预填充任务的词元预算数量和解码任务的词元预算数量，使解码任务的词元预算数量占比与预填充任务的算力利用率成负相关，根据该根据词元预算数量将对应的待处理序列输入预训练语言模型进行并行推理计算，使得并行推理计算获得吞吐量和延迟的均衡，从而可以解决相关技术中并行推理调度中存在的设备压力与生成性能矛盾的问题，达到提升预训练语言模型的并行推理性能的技术效果，提升了人工智能问答任务的执行性能。

技术关键词

信息生成方法预训练语言模型解码序列内存计算机程序产品键值可读存储介质存储计算机程序人工智能技术处理器矩阵散热风扇电子设备分块存储器损耗指标

系统为您推荐了相关专利信息

一种敏感数据信息传输方法、装置、存储介质及电子设备

编码图像数据信息传输方法加密图像数据解密图像信息传输装置

一种IO模块自动化生产过程中自动检测方法及系统

IO模块传输路径自动检测方法测量点电气

一种基于电子设备的鲁棒性评估系统

鲁棒性评估无线网络模块储存单元程序

一种基于国产实时操作系统软件人机界面自定义配置方法

实时操作系统人机界面国产操作系统软件计算机人机交互

多类型电解槽协同运行的混合电解水制氢系统及方法

电解水制氢系统智能电源模块阴离子交换膜碱性电解槽激光气体分析仪

一种应答信息生成方法、设备、介质及计算机程序产品

站点导航

APP 下载