摘要
本发明提供一种基于多智能体强化学习的双臂机器人协同控制方法,包括将双臂机器人的系统控制转化为马尔可夫决策问题;建立双臂机器人仿真环境,并根据强化学习问题设计回合及任务;构建多智能体强化学习模型,通过多智能体强化学习模型对仿真模型进行训练。本发明将两条机械臂分别看作一个独立的智能体进行多智能体强化学习训练更加符合其实际的运动情况,有效提高协同任务的成功率;在选择动作时,先通过Critic网络对动作进行评分,再比较两个动作的评分,选取评分更高的动作执行,解决训练过程中出现的动作局部最优的问题、Critic网络评判动作价值时出现的过估计或低估问题,提高双臂机器人协同控制任务的稳定性和精确性。
技术关键词
多智能体强化学习
双臂机器人
协同控制方法
网络
仿真环境
仿真模型
机械臂
系统控制
随机噪声
参数
强化学习模型
梯度下降算法
物体
夹具
更新方法
优化器
样本
关系
系统为您推荐了相关专利信息
化妆品防腐剂检测
邻域
参数识别器
固相
化妆品检测技术
异常识别方法
生成攻击样本
协议
生成器网络
日志关联分析
风机故障预测方法
风机运行状态
风机控制装置
隧道智能
神经网络模型
数据加密传输方法
加密算法
应用层隧道
QUIC协议
终端设备
谐振电感组件
谐振电路
控制开关
电源装置配置
谐振电容