用于大模型训练的拓扑文件生成方法、装置、设备及介质

AITNT
正文
推荐专利
用于大模型训练的拓扑文件生成方法、装置、设备及介质
申请号:CN202510706155
申请日期:2025-05-29
公开号:CN120562564A
公开日期:2025-08-29
类型:发明专利
摘要
本申请公开了用于大模型训练的拓扑文件生成方法、装置、设备及介质,涉及云计算技术领域,包括:利用预先部署的目标控制器组件对kubernetes集群中资源的变化进行监听;若kubernetes集群中创建新的目标资源,则通过目标控制器组件解析新的目标资源中的图形处理器拓扑信息,以获取物理节点与图形处理器拓扑信息的映射关系;若集群中创建新的Pod资源,且新的Pod资源中包含图形处理器资源信息,则通过目标控制器组件修改新Pod的定义,以生成相应的初始化容器;基于请求参数以及映射关系利用初始化容器访问目标控制器组件,以获取用于大模型训练的目标物理节点的NCCL拓扑文件。由此提升了图形处理器间的通信效率。
技术关键词
控制器组件 图形处理器 文件生成方法 集群 节点 应用程序编程接口 物理 扩展标记语言文件 容器 资源管理对象 可扩展标记语言 文件生成装置 参数 关系 可读存储介质 云计算技术 存储计算机程序
系统为您推荐了相关专利信息
1
基于数字孪生的化工园区应急处理方法
数字孪生 栅格 混合智能优化算法 运输智能 资源供应
2
一种具有质量追溯功能的异性纤维分检系统及其方法
异性纤维分检系统 数据采集装置 棉花原料 追溯功能 异纤机
3
基于联合增广图对比学习的认知安全设备状态识别方法
状态识别方法 节点 安全设备 特征值 矩阵
4
一种专利信息推送管理系统及方法
信息推送管理系统 规则知识库 基准 节点 文本
5
一种用于船舶的三维仿真模型
三维仿真模型 拖船 缆绳 动态显示功能 船舶
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号