摘要
本发明公开了一种融合Q‑学习与双线权值算法的多机器人协同任务分配方法,包括:设定多机器人系统双线无权值任务分配实例;构建马尔可夫决策过程,设定训练参数,根据Q‑学习算法对多机器人系统双线无权值任务分配实例进行训练,不断更新Q值表,找到完成多机器人系统双线无权值任务分配的最优决策。在多机器人系统双线无权值任务分配实例基础上,引入权值参数,设定引入权值参数的多机器人系统双线权值任务分配实例;构建马尔可夫决策过程,设定训练参数,根据Q‑学习算法对多机器人系统双线权值任务分配实例进行训练,不断更新Q表格,找到完成多机器人系统双线权值任务分配的最优决策。本发明具有计算速度快,资源消耗低的优点。
技术关键词
多机器人系统
双线
任务分配方法
决策
学习算法
贪婪策略
标志位
参数
采取行动
矩阵
代表
元素
状态更新
因子
表格
基础