一种面向人工智能大模型高效训练的并行策略搜索方法

正文

推荐专利

申请号：CN202411442290

申请日期：2024-10-16

公开号：CN118966321A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种面向人工智能大模型高效训练的并行策略搜索方法，涉及人工智能技术领域，具体包括以下步骤：S1、输入人工智能大模型；S2、利用TensorFlow框架可视化人工智能大模型，生成大模型的计算图g，获取集群设备的拓扑图D；该面向人工智能大模型高效训练的并行策略搜索方法，通过挖掘神经网络模型并行训练过程中的计算和通信特点，建立分布式训练性能评估模型，更准确地评估并行策略的综合性能，通过采用双层策略网络构建智能体，减少搜索过程中的开销，防止内存溢出，通过采用随机梯度上升算法有利于算法在参数改变可能导致新旧策略概率分布的剧烈变化时保持平稳收敛。

技术关键词

并行策略搜索方法 TensorFlow框架分布式训练拓扑图内存集群模拟器浮点操作数算法参数衡量设备人工智能技术神经网络模型顶点规模综合性样本

系统为您推荐了相关专利信息

陆战对抗场景的异构智能体训练方法、系统及存储介质

注意力机制策略分布式训练网络异构

一种基于信息相关性的随机接入网络信息时效性优化方法

接入网络时效性年龄矩阵无线通信场景

适用于异形管母绝缘层绕制的复合机器人循迹方法及系统

复合机器人执行器循迹方法移动底盘轴心

一种基于优化数据存储分配的信息服务方法及系统

信息服务方法多层神经网络模型信息服务系统梯度下降算法数据存储系统

电磁信号图文的数据搜索方法、装置、设备、介质及产品

语义特征图文文本电磁数据搜索方法

一种面向人工智能大模型高效训练的并行策略搜索方法

站点导航

APP 下载