摘要
本申请提出了一种分布式的强化学习训练系统、方法及电子设备,涉及人工智能技术领域。该系统包括分布式环境采样单元、智能体训练单元及分布式对象存储单元。分布式环境采样单元设多个并行采样器,各含仿真环境与Runner模块,Runner接收动作信号,在仿真环境中执行并收集信息,存入经验池。智能体训练单元含Action与Learner模块,Action基于最新状态数据生成动作指令至采样器,Learner从经验池获取数据优化模型。分布式对象存储单元作为经验池,存储所有采样器数据,并与智能体训练单元交互。三者通过数据同步机制协调,包括数据同步与梯度同步。该系统能够更好的满足在数据同步、传输效率、模型滞后以及算法支持度等方面的训练需求。
技术关键词
仿真环境
分布式对象
分布式环境
学习训练系统
采样器
数据同步
模块
生成动作
存储单元
强化学习算法
模型更新
深度学习训练
电子设备
机制
超参数
批量数据
人工智能技术
定义
指令
系统为您推荐了相关专利信息
波分复用传输系统
链路功率控制方法
波长选择开关
波分复用系统
信噪比
综合检测系统
跨度
虚拟仿真环境
分析模块
综合检测平台
决策方法
多模态数据采集
执行误差
仿真环境
跨模态
数控机床
缺陷检测方法
仿真环境
图像编码器
轨迹生成器