一种分布式的强化学习训练系统、方法及电子设备

AITNT
正文
推荐专利
一种分布式的强化学习训练系统、方法及电子设备
申请号:CN202510243507
申请日期:2025-03-03
公开号:CN120181181A
公开日期:2025-06-20
类型:发明专利
摘要
本申请提出了一种分布式的强化学习训练系统、方法及电子设备,涉及人工智能技术领域。该系统包括分布式环境采样单元、智能体训练单元及分布式对象存储单元。分布式环境采样单元设多个并行采样器,各含仿真环境与Runner模块,Runner接收动作信号,在仿真环境中执行并收集信息,存入经验池。智能体训练单元含Action与Learner模块,Action基于最新状态数据生成动作指令至采样器,Learner从经验池获取数据优化模型。分布式对象存储单元作为经验池,存储所有采样器数据,并与智能体训练单元交互。三者通过数据同步机制协调,包括数据同步与梯度同步。该系统能够更好的满足在数据同步、传输效率、模型滞后以及算法支持度等方面的训练需求。
技术关键词
仿真环境 分布式对象 分布式环境 学习训练系统 采样器 数据同步 模块 生成动作 存储单元 强化学习算法 模型更新 深度学习训练 电子设备 机制 超参数 批量数据 人工智能技术 定义 指令
系统为您推荐了相关专利信息
1
相干光波分复用传输系统的链路功率控制方法和系统
波分复用传输系统 链路功率控制方法 波长选择开关 波分复用系统 信噪比
2
一种急性缺血性脑卒中侧支循环无创评估方法及计算设备
分区模型 图像分割模型 空间变换网络 图谱 血管
3
一种基于数据分析的无人机运行性能综合检测系统
综合检测系统 跨度 虚拟仿真环境 分析模块 综合检测平台
4
一种融合评估体系的多智能体协同决策方法、系统及设备
决策方法 多模态数据采集 执行误差 仿真环境 跨模态
5
数控机床加工轨迹规划缺陷检测方法、系统、设备及介质
数控机床 缺陷检测方法 仿真环境 图像编码器 轨迹生成器
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号