复杂场景的机器人智能体强化学习训练方法及系统

AITNT
正文
推荐专利
复杂场景的机器人智能体强化学习训练方法及系统
申请号:CN202411622371
申请日期:2024-11-14
公开号:CN119129642B
公开日期:2025-02-18
类型:发明专利
摘要
本发明公开了一种复杂场景的机器人智能体强化学习训练方法,其通过构建包含障碍物、动态目标以及环境约束等复杂场景、适用于多智能体系统的强化学习算法环境、状态转移模型,并采用强化学习算法构建为每个机器人智能体构建独立的神经网络;将智能体的给定状态、时序信息、历史状态信息的向量作为所述状态转移模型的输入,输出预测状态的状态转移概率和奖励信息;所述神经网络输出的动作策略和动作价值通过所述状态转移模型中执行并产生新的预测状态和奖励信息;通过调整神经网络的超参数,利用大规模分布式训练架构对所述决策网络和所述评估网络进行协作训练,实现多智能体的并行学习和协同决策,提高智能体在复杂场景中的性能表现和泛化能力。
技术关键词
强化学习算法 动作策略 构建状态转移模型 学习训练方法 障碍物 机器人本体 环境感知信息 决策 神经网络模型 场景 分布式训练 智能体系统 学习训练系统 梯度算法 分解算法 连续动作空间 多智能体协同
系统为您推荐了相关专利信息
1
一种基于LSTM和DDPG算法的无人艇路径跟踪控制方法及系统
路径跟踪控制方法 无人艇 网络模块 信息采集模块 强化学习算法
2
用于天然气红外光谱测量的实时反馈与自适应学习方法
样本 学习方法 XGBoost模型 天然气 Siamese网络
3
基于人工智能的海关进出口数据分析技术系统
数据分析技术 变分贝叶斯 深度强化学习算法 模块 人工智能算法
4
一种融合多维度数据的高校音乐专业学生就业前景分析方法
学生 分析方法 人工智能算法 强化学习算法 音乐
5
一种基于大数据的车辆刹车提醒方法及系统
车辆刹车 提醒方法 周围环境数据 大数据 刹车提醒系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号