摘要
一种用于多任务场景下的多机器人控制方法,包含通用策略网络和任务专用策略网络,通用策略网络通过多层感知机或图神经网络处理机器人传感器观测数据,提取基础行为特征;任务专用策略网络的参数矩阵由超网络根据离散任务标识符动态生成,用于适配分拣力度控制等任务特异性行为修正。两网络输出通过可调融合权重加权求和生成最终控制动作,训练初期以通用策略为主导保证稳定性,后期增强任务特异性。该方法可嵌入多智能体强化学习框架进行集成训练,并支持分布式策略部署。此外,本发明还提供移除通用分支的简化版和级联结构等变形方案,能有效应用于仓储机器人任务切换、工业机械臂多任务执行等场景,实现高效轻量化的多机器人多任务控制。
技术关键词
机器人控制方法
多智能体强化学习
分布式策略
标识符
机器人传感器
多任务
集成训练
优化网络参数
多层感知机
中央控制器
生成机器人
超网络
双分支网络
场景
仓储机器人
模态传感器
工业机械臂