摘要
本发明提出了一种混合三类经验的MADDPG多智能体运动控制方法,属于多智能体深度强化学习领域。MADDPG算法在专家经验的基础上引入劣质经验和优秀经验;劣质经验由反例模块生成,优秀经验由事后经验回放模块生成;通过融合专家经验、劣质经验和优秀经验构建三类经验混合机制,从而提高MADDPG算法的训练效率和稳定性;提升训练样本的多样性和质量,增强多智能体系统在复杂动态环境中的稳定性和决策能力;通过集成反例模块生成劣质经验,能在不确定环境中执行高效且可靠的运动控制,显著提高了多智能体系统的适应性和鲁棒性。
技术关键词
运动控制方法
网络
策略
多智能体系统
人工势场法
障碍物
代表
加速度
参数
状态转移模型
传感器
多智能体深度强化学习
算法
物体
融合专家经验
轨迹
噪声模型
系统为您推荐了相关专利信息
卫星定位数据
特征地图
机器人定位方法
线特征
机器人行进路径
配电网调控
投切电容器组
调节变压器
分布式电源
数据
水文模拟方法
作物生长模型
数据
动态调整机制
卷积神经网络学习