一种分布式AI训练任务的处理方法及系统

AITNT
正文
推荐专利
一种分布式AI训练任务的处理方法及系统
申请号:CN202510870213
申请日期:2025-06-26
公开号:CN120704893A
公开日期:2025-09-26
类型:发明专利
摘要
一种分布式AI训练任务的处理方法及系统,涉及云计算技术领域。该分布式AI训练任务的处理方法包括:分别为各云平台每个集群的节点的硬件资源设置标签,并获取每个硬件资源的资源信息;通过集群中预先部署的webhook服务,拦截包含硬件资源数量请求的CRD配置文件,并根据上述标签将上述CRD配置文件中的资源信息修改为该集群硬件环境适配的参数格式后,创建携带该硬件资源数量请求的AI训练任务。本申请不仅可实现多云平台异构资源中硬件资源能被统一调度和使用,不用人工干预,且经由部署在集群中的webhook服务可完成硬件资源配置的动态参数适配和自动注入,实现跨云平台、跨硬件架构的无缝资源调度与适配。
技术关键词
集群 节点 跨硬件架构 构建容器镜像 硬件资源配置 标签 跨云平台 多云平台 云计算技术 格式 参数 链路 队列 动态 异构 模块
系统为您推荐了相关专利信息
1
一种消息广播系统、方法、装置、存储介质及电子设备
客户端 节点 队列 服务器 心跳报文
2
数据处理方法、K8s服务系统及计算机可读存储介质
K8s集群 虚拟机实例 控制面节点 数据处理方法 对象
3
基于数据分析的订单采购及配送方法、系统及装置
订单 配送方法 物流 SVM分类 服务质量数据
4
数据卷加解密方法、装置、设备、存储介质、计算机程序产品及系统
加解密方法 容器 数据 加解密装置 加密
5
一种边坡垮塌风险评估方法及系统
故障树模型 风险评估方法 水文 边坡 情景
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号