一种基于强化学习模型的机器人群体协调方法

正文

推荐专利

申请号：CN202410733762

申请日期：2024-06-07

公开号：CN118586555A

公开日期：2024-09-03

类型：发明专利

摘要

本发明公开了基于强化学习模型的机器人群体协调方法，包括以下步骤：每个机器人被隐马尔科夫模型分配角色；机器人i将历史观测和动作编码成机器人i轨迹τi，来自机器人i和轨迹τi的观测值被送入强化学习网络；所述强化学习网络为角色分配效用矩阵，对效用矩阵进行张量环分解后，动态调整秩的大小，以优化单个机器人的局部效用；单个机器人的局部效用优化之后，所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化；每个机器人根据优化后的局部观测做出独立决策。本申请动态调整张量秩的大小，使得单个无人机的局部效用得到优化；对无人机通过全局信息对局部观测优化，从而对无人机进行统一协调。

技术关键词

强化学习模型机器人强化学习网络隐马尔科夫模型矩阵飞行轨迹控制观测误差 ADMM算法无人机群体控制无人机序列动态决策编码数据

系统为您推荐了相关专利信息

一种光伏板清洗机器人的可螺旋压缩水清洗机构

光伏板清洗机器人片体开口轴套喷雾机构清洗机构

基于轨迹和同帧画幅约束的光测脱靶量处理方法及系统

脱靶量坐标系运动特征参数轨迹方位角

基于多通道奇异谱分析的电离层异常提取方法

协方差矩阵多通道序列格网重构模型

一种降低音频灯光同步延迟系统及装置

灯光延迟系统联合编解码音频特征提取矩阵

一种适用于辐射状配电网的序列修正二阶锥全局优化方法

辐射状配电网全局优化方法变量上下层电力系统

一种基于强化学习模型的机器人群体协调方法

站点导航

APP 下载