基于多智能体强化学习的机器人控制方法、装置和设备

正文

推荐专利

申请号：CN202411971854

申请日期：2024-12-30

公开号：CN119458375B

公开日期：2025-09-19

类型：发明专利

摘要

本发明提供一种基于多智能体强化学习的机器人控制方法、装置和设备，其中方法包括：依据预置规则对机器人群协作系统中的每一机器人的初始神经网络的策略参数进行自适应重置；将每一机器人当前时刻的样本观测数据和上一时刻的样本动作输入至每一机器人的初始神经网络，得到每一机器人的局部预测回报值；根据每一机器人的局部预测回报值，计算全局预测回报值，融合每一机器人的初始神经网络的参数；更新每一机器人的经验池，从每一机器人的经验池中采集样本数据，周期性地重复每一机器人的训练过程，直至达到预设收敛条件；基于训练好的每一机器人的神经网络控制每一机器人完成协作任务。本发明能够提高探索行为的多样性和广度，提高探索效率。

技术关键词

多智能体强化学习机器人控制方法协作系统样本轨迹周期性地重复参数非暂态计算机可读存储介质混合网络数据策略机器人控制装置机器人抓取处理器存储器控制单元物体电子设备

系统为您推荐了相关专利信息

一种五合一激光切割的方法及系统

激光切割系统坐标轨迹卡盘直线轴

一种基于多模态分析的危险行为识别与预警方法

多模态预警方法迁移学习方法文本特征向量样本

爆胎车辆的轨迹规划方法、电子装置、车辆、介质和产品

爆胎车辆轨迹规划方法拟合算法车辆状态参数加速度

一种六自由度空间位姿测量设备校准方法、装置及系统

六自由度并联机构六自由度空间控制点轨迹设备校准方法

一种歌曲推荐模型训练方法、歌曲推荐方法及其相关装置

推荐模型训练方法音频特征提取歌曲推荐方法文本歌曲推荐装置

基于多智能体强化学习的机器人控制方法、装置和设备

站点导航

APP 下载