模型部署方法、装置、计算机设备及存储介质

AITNT
正文
推荐专利
模型部署方法、装置、计算机设备及存储介质
申请号:CN202510419833
申请日期:2025-04-03
公开号:CN120371470A
公开日期:2025-07-25
类型:发明专利
摘要
本申请揭示一种模型部署方法、装置、计算机设备及存储介质,该方法包括:通过响应模型部署请求,从模型广场中确定目标模型;基于动态映射表获取目标模型的模型支持信息;获取模型支持信息对应的每个计算节点的算力资源指标数据;基于每个计算节点的算力资源指标数据和动态映射表部署目标模型。本申请可以避免因用户对算力资源估算偏差,导致算力资源不足或者过剩;可以精准灵活地为目标模型分配算力资源并进行部署,可以避免算力资源不足的情况发生,且在计算节点出现故障时,可以根据每个计算节点的算力源指标数据动态调整目标模型的算力资源分配,从而提高整体资源利用率。
技术关键词
模型部署方法 节点 动态 广场 指标 计算机设备 调度算法 数据 可读存储介质 处理器 资源分配 模块 存储器 标签 框架 偏差
系统为您推荐了相关专利信息
1
一种基于人工智能技术的无人机反制预案生成方法及系统
反制装置 电磁信号频谱 预案生成方法 无人机反制 地理围栏
2
基于智能合约的私有通信协议管理方法和系统
私有协议 私有通信协议 报文 随机森林模型 管理方法
3
一种基于信息链的数字经济整合与优化方法及系统
数据整合平台 市场动态 数据分析模块 多头注意力机制 更新模型参数
4
图像生成方法及装置、电子设备和可读存储介质
图像生成方法 文本 图像生成装置 处理单元 控件
5
基于医疗紧急度的轮椅调度方法、轮椅控制方法及系统
调度控制终端 轮椅控制方法 调度终端 医院信息系统 生成用户
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号