一种面向人工智能大模型高效训练的并行策略搜索方法

AITNT
正文
推荐专利
一种面向人工智能大模型高效训练的并行策略搜索方法
申请号:CN202411442290
申请日期:2024-10-16
公开号:CN118966321A
公开日期:2024-11-15
类型:发明专利
摘要
本发明公开了一种面向人工智能大模型高效训练的并行策略搜索方法,涉及人工智能技术领域,具体包括以下步骤:S1、输入人工智能大模型;S2、利用TensorFlow框架可视化人工智能大模型,生成大模型的计算图g,获取集群设备的拓扑图D;该面向人工智能大模型高效训练的并行策略搜索方法,通过挖掘神经网络模型并行训练过程中的计算和通信特点,建立分布式训练性能评估模型,更准确地评估并行策略的综合性能,通过采用双层策略网络构建智能体,减少搜索过程中的开销,防止内存溢出,通过采用随机梯度上升算法有利于算法在参数改变可能导致新旧策略概率分布的剧烈变化时保持平稳收敛。
技术关键词
并行策略 搜索方法 TensorFlow框架 分布式训练 拓扑图 内存 集群 模拟器 浮点操作数 算法 参数 衡量设备 人工智能技术 神经网络模型 顶点 规模 综合性 样本
系统为您推荐了相关专利信息
1
基于大数据的网络服务质量监测与优化调度方法及系统
服务质量监测 拓扑图 联邦学习模型 节点 资源
2
一种烟草智慧分拣调度方法
分拣设备 分拣工作 订单 烟草产品 更新控制系统
3
一种基于生成式模型隔离的隐私数据安全共享系统
数据安全共享 安全监控管理 数据共享系统 仿真数据 合规性
4
一种电动汽车充电路径规划方法和系统
充电站 延迟参数 充电路径规划 非线性映射关系 因子
5
一种基于UV-Vis结合化学计量学和机器学习算法的再生涤纶鉴别方法
机器学习算法 再生涤纶纤维 鉴别方法 网络搜索方法 涤纶纤维材料
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号