一种面向人工智能大模型高效训练的并行策略搜索方法

正文

推荐专利

申请号：CN202510488064

申请日期：2025-04-18

公开号：CN120012879B

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种面向人工智能大模型高效训练的并行策略搜索方法，涉及人工智能技术领域，包括，通过训练NeRF模型，生成三维硬件拓扑场；解析待训练大模型的计算图，将算子节点映射至三维硬件拓扑场中，生成标注计算图；基于标注计算图构建混合整数规划模型，输出候选策略集合；将候选策略集合输入双层策略网络，输出并行策略集合；在模拟器中加载三维硬件拓扑场，对并行策略集合进行验证和调整，输出最优策略；部署最优策略至真实集群，触发重新筛选策略。本发明基于神经辐射场建模物理级硬件通信场，融合混合整数规划与深度强化学习，实现并行策略全局‑局部协同优化，实现训练效率、显存利用率与系统鲁棒性的多目标平衡。

技术关键词

并行策略搜索方法混合整数规划模型元胞自动机量子退火算法深度强化学习模拟器分片策略人工智能技术增量更新集群通信效率网络异常事件编码器注意力机制跨节点

系统为您推荐了相关专利信息

一种船用止裂钢厚板止裂韧性预测模型的建立方法

厚板特征参量动态撕裂网格搜索方法工程实用价值

图像搜索方法、装置、电子设备及存储介质

语义向量图像搜索方法数据图像搜索装置多模态

一种智慧城市公共服务的意见反馈多维评估系统

评估系统生成结构化数据混合整数规划模型多任务冲突情感关键词

一种基于改进YOLOv8的苹果叶片病害检测方法

病害检测方法叶片病虫害图像图像处理方法图像空间信息

一种卸货路径搜索方法及系统

路径搜索方法船舶路径搜索系统排列组合方法人机交互界面

一种面向人工智能大模型高效训练的并行策略搜索方法

站点导航

APP 下载