一种基于资源重分配的高可用的模型调度部署方法

AITNT
正文
推荐专利
一种基于资源重分配的高可用的模型调度部署方法
申请号:CN202410863298
申请日期:2024-06-29
公开号:CN119356803A
公开日期:2025-01-24
类型:发明专利
摘要
本发明公开了一种基于资源重分配的高可用的模型调度部署方法,推荐模型通过在线调度系统来进行资源分配,自适应扩缩容,完成模型的调度和部署;上述方法为自适应扩缩容方法,可以实现模型自动化部署,解放运维人力;为了通过缩短资源重分配时间间隔,提升实验变更过程中服务的高可用,本方案采用布林带策略来进行模型服务资源的动态调整,可以同时兼顾实时性,可用率与资源利用率;该方案平均一次资源调整只需要十几秒就能完成,且模型服务的日常可用率可以达到99.99%。
技术关键词
资源重分配 扩缩容方法 调度系统 资源分配 策略 计算方法 在线 场景 动态 运维 离线 网格 曲线 算法 人力 数据
系统为您推荐了相关专利信息
1
一种支持可变刷新率的DDIC芯片驱动时序控制方法
驱动时序控制方法 可变刷新率 动态帧率 动态电压频率调节 相位补偿机制
2
一种配电网-农业园区双层优化方法及系统
农业园区 配电网运营商 双层优化方法 温室大棚 双层优化模型
3
基于智能优化算法的雷电探测站布局方法和系统
雷电探测站 智能优化算法 布局方法 站点 因子
4
一种移动边缘计算任务卸载方法、系统、处理设备及存储介质
卸载方法 遗传算法 移动设备 计算机程序指令 卸载系统
5
一种铜铝焊接的焊接系统温度控制方法
焊接输出功率 焊接系统 温度控制方法 温度预测模型 铜铝
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号