摘要
本申请揭示一种模型部署方法、装置、计算机设备及存储介质,该方法包括:通过响应模型部署请求,从模型广场中确定目标模型;基于动态映射表获取目标模型的模型支持信息;获取模型支持信息对应的每个计算节点的算力资源指标数据;基于每个计算节点的算力资源指标数据和动态映射表部署目标模型。本申请可以避免因用户对算力资源估算偏差,导致算力资源不足或者过剩;可以精准灵活地为目标模型分配算力资源并进行部署,可以避免算力资源不足的情况发生,且在计算节点出现故障时,可以根据每个计算节点的算力源指标数据动态调整目标模型的算力资源分配,从而提高整体资源利用率。
技术关键词
模型部署方法
节点
动态
广场
指标
计算机设备
调度算法
数据
可读存储介质
处理器
资源分配
模块
存储器
标签
框架
偏差
系统为您推荐了相关专利信息
反制装置
电磁信号频谱
预案生成方法
无人机反制
地理围栏
私有协议
私有通信协议
报文
随机森林模型
管理方法
数据整合平台
市场动态
数据分析模块
多头注意力机制
更新模型参数
调度控制终端
轮椅控制方法
调度终端
医院信息系统
生成用户