摘要
请求处理方法、装置、电子设备和存储介质。本公开提供了一种请求处理方法,涉及人工智能技术领域,尤其涉及大模型、人工智能加速卡和芯片技术领域。具体实现方案为:根据用于至少一个待处理请求的目标规模信息,确定目标比例,目标规模信息是根据待处理请求之前的历史请求的历史规模信息确定的;在多个候选设备中确定用于至少一个待处理请求的至少一个目标预填充设备和至少一个目标解码设备,目标预填充设备的数量与目标解码设备的数量之间的数量比例与目标比例一致。本公开还提供了一种请求处理装置、电子设备和存储介质。
技术关键词
填充设备
解码设备
规模
噪声信息
人工智能加速卡
参数
电子设备
人工智能技术
计算机程序产品
处理器通信
指令
可读存储介质
存储器
模块
芯片
系统为您推荐了相关专利信息
声纹识别方法
高维特征向量
深度学习网络模型
预训练模型
大规模语音数据
网络安全预警方法
分布式协作
静态特征
矩阵
风险
无人机蜂群
测控通信系统
加密
飞行控制计算机
压缩算法
语音交互方法
语音生物特征
深度神经网络模型
迁移学习模型
带电作业环境