一种融合Q-学习与双线权值算法的多机器人协同任务分配方法

正文

推荐专利

申请号：CN202510951370

申请日期：2025-07-10

公开号：CN120851472A

公开日期：2025-10-28

类型：发明专利

摘要

本发明公开了一种融合Q‑学习与双线权值算法的多机器人协同任务分配方法，包括：设定多机器人系统双线无权值任务分配实例；构建马尔可夫决策过程，设定训练参数，根据Q‑学习算法对多机器人系统双线无权值任务分配实例进行训练，不断更新Q值表，找到完成多机器人系统双线无权值任务分配的最优决策。在多机器人系统双线无权值任务分配实例基础上，引入权值参数，设定引入权值参数的多机器人系统双线权值任务分配实例；构建马尔可夫决策过程，设定训练参数，根据Q‑学习算法对多机器人系统双线权值任务分配实例进行训练，不断更新Q表格，找到完成多机器人系统双线权值任务分配的最优决策。本发明具有计算速度快，资源消耗低的优点。

技术关键词

多机器人系统双线任务分配方法决策学习算法贪婪策略标志位参数采取行动矩阵代表元素状态更新因子表格基础

一种融合Q-学习与双线权值算法的多机器人协同任务分配方法

站点导航

APP 下载