摘要
本发明公开了一种基于强化学习的多机器人多目标大规模追击逃逸方法,属于多目标追击逃逸技术领域。追击逃逸方法包括如下:初始化建模,对关键变量和任务进行建模,初始化变量;追击逃逸建模,设定所有机器人在固定的感知半径中,并将机器人分为追击者和逃逸者;通过Transformer架构的自注意力机制,动态调整关键变量权重,进行追击逃逸建模,使得机器人的目标选择更加智能,不会出现多个机器人过度集中追击同一个目标,而其他目标无机器人追踪的问题;从而提高追击的效率;计算追击者与逃逸者之间的距离,判断追击者是否捕获到逃逸者,使得机器人的目标选择更加智能;从而提高追击的效率。
技术关键词
逃逸方法
机器人
障碍物
课程学习方法
变量
注意力机制
强化学习策略
决策
阶段
判断方法
定义
加速度
动态
数学
逻辑
因子
线性
系统为您推荐了相关专利信息
调车作业
计划优化方法
调车机车
节点
非线性整数规划
负荷历史数据
注意力机制
嵌入位置信息
样本
电力系统负荷预测