强化学习计算模拟方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202511233002

申请日期：2025-08-29

公开号：CN120725093B

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了一种强化学习计算模拟方法、装置、电子设备及存储介质，涉及人工智能计算技术领域，包括将已确定的当前模型参数配置、当前硬件配置和当前工作负载输入至目标模拟系统得到多个并行分组组合，根据当前硬件配置确定目标模拟系统，基于预设的蒙特卡洛方法，从多个并行分组组合中确定有效并行分组组合，并输入至预设的神经网络模型的模拟器，通过模拟器根据有效并行分组组合进行延迟时间计算，且将最短延迟时间对应的组合作为目标并行分组组合，解决了模拟场景不匹配、精度不足、缺乏对异构集群有效支持的技术问题，通过高精度的性能建模和自动化探索，提供可靠的性能预测和最优并行策略建议，从而降低大规模GRPO训练的资源消耗。

技术关键词

神经网络模型模拟系统集群蒙特卡洛方法模拟器阶段人工智能计算技术异构并行策略参数电子设备可读存储介质图形处理器计算机程序产品模拟装置数值序列模块存储器

系统为您推荐了相关专利信息

一种多无人机巡检轨迹和移动储能端调度巡检方法及系统

巡检轨迹充电调度策略多无人机无人机巡检储能

一种基于Web的实时3D数字人模拟系统和方法

肢体动作识别头部姿态识别模拟系统识别模块坐标

一种基于多源数据的多维度融合找矿预测方法

卷积神经网络模型数据决策树模型空间分布特征节点

虚拟机械臂控制状态管理方法、设备、介质及程序产品

系统协调器状态管理方法机械臂控制器手术模拟器系统手术场景

资源展示方法、装置、设备及存储介质

展示界面设备组件主机交换机组件物理设备

强化学习计算模拟方法、装置、电子设备及存储介质

站点导航

APP 下载