摘要
本发明公开了一种基于人工智能的算力弹性调度方法及系统,包括:生成人工智能模型的服务镜像以及各子模块对应的子服务镜像;生成多个容器,将服务镜像和子服务镜像设置于容器内并挂载异构算力资源平台上;分析各子模块的算力需求和算力类型,以及各异构算力资源平台的最佳算力类型;从两个以上异构算力资源平台调用算力资源相符的子服务镜像执行所述计算请求数据,得到人工智能模型的计算结果。本发明可以使同一人工智能模型兼容多个异构算力资源平台,并且可以使异构算力资源平台分配处理其计算效率最佳的数据类型对应的子模块。
技术关键词
人工智能模型
弹性调度方法
异构
弹性调度系统
镜像
子模块
平台
生成容器
资源组
策略
配额
数据
关系
语音
视频
接收端
对象