一种基于强化学习模型的机器人群体协调方法

AITNT
正文
推荐专利
一种基于强化学习模型的机器人群体协调方法
申请号:CN202410733762
申请日期:2024-06-07
公开号:CN118586555A
公开日期:2024-09-03
类型:发明专利
摘要
本发明公开了基于强化学习模型的机器人群体协调方法,包括以下步骤:每个机器人被隐马尔科夫模型分配角色;机器人i将历史观测和动作编码成机器人i轨迹τi,来自机器人i和轨迹τi的观测值被送入强化学习网络;所述强化学习网络为角色分配效用矩阵,对效用矩阵进行张量环分解后,动态调整秩的大小,以优化单个机器人的局部效用;单个机器人的局部效用优化之后,所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化;每个机器人根据优化后的局部观测做出独立决策。本申请动态调整张量秩的大小,使得单个无人机的局部效用得到优化;对无人机通过全局信息对局部观测优化,从而对无人机进行统一协调。
技术关键词
强化学习模型 机器人 强化学习网络 隐马尔科夫模型 矩阵 飞行轨迹控制 观测误差 ADMM算法 无人机群体 控制无人机 序列 动态 决策 编码 数据
系统为您推荐了相关专利信息
1
一种光伏板清洗机器人的可螺旋压缩水清洗机构
光伏板清洗机器人 片体 开口轴套 喷雾机构 清洗机构
2
基于轨迹和同帧画幅约束的光测脱靶量处理方法及系统
脱靶量 坐标系 运动特征参数 轨迹 方位角
3
基于多通道奇异谱分析的电离层异常提取方法
协方差矩阵 多通道 序列 格网 重构模型
4
一种降低音频灯光同步延迟系统及装置
灯光 延迟系统 联合编解码 音频特征提取 矩阵
5
一种适用于辐射状配电网的序列修正二阶锥全局优化方法
辐射状配电网 全局优化方法 变量 上下层 电力系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号