复杂场景的机器人智能体强化学习训练方法及系统

正文

推荐专利

申请号：CN202411622371

申请日期：2024-11-14

公开号：CN119129642B

公开日期：2025-02-18

类型：发明专利

摘要

本发明公开了一种复杂场景的机器人智能体强化学习训练方法，其通过构建包含障碍物、动态目标以及环境约束等复杂场景、适用于多智能体系统的强化学习算法环境、状态转移模型，并采用强化学习算法构建为每个机器人智能体构建独立的神经网络；将智能体的给定状态、时序信息、历史状态信息的向量作为所述状态转移模型的输入，输出预测状态的状态转移概率和奖励信息；所述神经网络输出的动作策略和动作价值通过所述状态转移模型中执行并产生新的预测状态和奖励信息；通过调整神经网络的超参数，利用大规模分布式训练架构对所述决策网络和所述评估网络进行协作训练，实现多智能体的并行学习和协同决策，提高智能体在复杂场景中的性能表现和泛化能力。

技术关键词

强化学习算法动作策略构建状态转移模型学习训练方法障碍物机器人本体环境感知信息决策神经网络模型场景分布式训练智能体系统学习训练系统梯度算法分解算法连续动作空间多智能体协同

系统为您推荐了相关专利信息

一种基于LSTM和DDPG算法的无人艇路径跟踪控制方法及系统

路径跟踪控制方法无人艇网络模块信息采集模块强化学习算法

用于天然气红外光谱测量的实时反馈与自适应学习方法

样本学习方法 XGBoost模型天然气 Siamese网络

基于人工智能的海关进出口数据分析技术系统

数据分析技术变分贝叶斯深度强化学习算法模块人工智能算法

一种融合多维度数据的高校音乐专业学生就业前景分析方法

学生分析方法人工智能算法强化学习算法音乐

一种基于大数据的车辆刹车提醒方法及系统

车辆刹车提醒方法周围环境数据大数据刹车提醒系统

复杂场景的机器人智能体强化学习训练方法及系统

站点导航

APP 下载