一种模型部署方法、装置、设备、存储介质和产品

正文

推荐专利

申请号：CN202511224090

申请日期：2025-08-29

公开号：CN120745844B

公开日期：2025-11-07

类型：发明专利

摘要

本申请公开了一种模型部署方法、装置、设备、存储介质和产品，涉及多元异构计算系统技术领域，依据混合专家模型的分布式推理任务信息以及异构计算系统的性能信息，确定出每个专家模型在其对应的异构计算节点上执行推理任务的总耗时。基于负载均衡原则，对所有专家模型的总耗时、通信耗时和计算耗时进行分析，以确定出压缩倍率；按照模型压缩策略对各专家模型进行迭代压缩，以得到满足误差要求以及满足压缩倍率要求的各压缩后的专家模型。将各压缩后的专家模型部署在对应的异构计算节点。通过对专家模型进行压缩，并且基于压缩倍率确定专家模型的压缩程度，从而使不同异构算力在专家运算层的计算耗时尽量均衡，提升了硬件资源的利用率。

技术关键词

模型部署方法异构计算系统模型压缩节点误差压缩单元时延执行乘法可读存储介质存储计算机程序策略尺寸计算机程序产品处理器网络结构关系电子设备存储器

系统为您推荐了相关专利信息

一种群组密钥管理方法、系统、电子设备及存储介质

群组密钥管理方法终端设备身份认证信息逻辑业务系统

虚拟机备份方法、装置、计算机设备、可读存储介质和程序产品

虚拟机集合主节点虚拟机备份方法管理服务器故障告警信息

一种基于区块链的负荷侧分布式资源可信交易方法及系统

可信交易方法负荷预测模型分布式资源属性基加密功率

一种风机发电功率的控制方法及相关设备

预测控制算法历史运行数据风机发电功率灰狼算法发电机结构

一种基于六维力传感器的足底和脚踝受力检测方法

受力检测方法六维力传感器力矩机器人足部识别步态

一种模型部署方法、装置、设备、存储介质和产品

站点导航

APP 下载