摘要
本申请公开了一种模型推理性能优化方法、装置、设备和存储介质,包括:响应于接收到推理请求,识别目标推理模型的结构特征,根据结构特征确定目标推理模型的类型,其中推理请求包括请求参数,目标推理模型用于执行推理请求,根据目标推理模型的类型和请求参数确定第一资源分配,获取系统负载数据,根据系统负载数据确定系统负载状态等级,根据第一资源分配和系统负载状态等级确定第二资源分配,根据第二资源分配对推理请求进行计算,得到推理结果,通过该方法,能够优化资源利用率并提升系统吞吐量。
技术关键词
性能优化方法
资源分配
数据
优化资源利用率
性能优化装置
参数
生成哈希值
高带宽
处理器
频率
哈希算法
序列
提升系统
网络
计算机设备
模块
可读存储介质
格式
存储器
系统为您推荐了相关专利信息
序列比对方法
马尔可夫模型
维特比解码
解码算法
队列
监测方法
支持向量机分类器
阶段
光纤光栅传感器
装备
生物信息分析系统
分类边界
代表
跨模态数据
子模块