摘要
本发明公开了一种面向人工智能大模型高效训练的并行策略搜索方法,涉及人工智能技术领域,具体包括以下步骤:S1、输入人工智能大模型;S2、利用TensorFlow框架可视化人工智能大模型,生成大模型的计算图g,获取集群设备的拓扑图D;该面向人工智能大模型高效训练的并行策略搜索方法,通过挖掘神经网络模型并行训练过程中的计算和通信特点,建立分布式训练性能评估模型,更准确地评估并行策略的综合性能,通过采用双层策略网络构建智能体,减少搜索过程中的开销,防止内存溢出,通过采用随机梯度上升算法有利于算法在参数改变可能导致新旧策略概率分布的剧烈变化时保持平稳收敛。
技术关键词
并行策略
搜索方法
TensorFlow框架
分布式训练
拓扑图
内存
集群
模拟器
浮点操作数
算法
参数
衡量设备
人工智能技术
神经网络模型
顶点
规模
综合性
样本
系统为您推荐了相关专利信息
信息服务方法
多层神经网络模型
信息服务系统
梯度下降算法
数据存储系统