摘要
本发明提供了一种基于深度强化学习的多机器人分层编队控制方法及系统,属于非电变量的控制技术领域。所述的控制方法,包括:根据各机器人与机器人编队中的其他机器人的相对坐标以及基于LSTM的自编码器网络,得到各个机器人的障碍物信息的定长编码,以所述障碍物信息的定长编码以及各机器人的位置坐标信息、各机器人的运动速度、各机器人与当前时刻参考点的相对坐标作为多机器人分层控制模型的输入,得到机器人编队中各个机器人的行动策略;本发明能够快速学习并跟随目标点,有效的避免了机器人碰撞,在多机器人实时编队任务的控制中具有较强的泛化能力。
技术关键词
深度强化学习
状态编码器
编队控制方法
分层
编队控制系统
分布式一致性算法
奖惩方法
样本训练方法
分布式控制方法
机器人本体
障碍物位置信息
坐标
机器人协作
后机器人
预训练模型
机器人系统
系统为您推荐了相关专利信息
交互系统
寺庙
高精度三维模型
无人机倾斜摄影
文化遗产数字化保护
忆阻器阵列
聚类优化方法
高斯混合模型
后验概率
样本