一种基于多智能体强化学习追逃博弈中的有限时间逃避策略

正文

推荐专利

申请号：CN202410812499

申请日期：2024-06-21

公开号：CN118643888A

公开日期：2024-09-13

类型：发明专利

摘要

本发明涉及一种基于多智能体强化学习追逃博弈中的有限时间逃避策略，属于强化学习和追逃博弈领域；首先在DQN算法的基础上，根据追逐者采用放牧策略，逃避者通过自身的机动性，对动作空间进行了重新考虑；接下来本发明设置了五种基本动作，利用DQN算法的迭代过程，根据追逐者和逃避者的相对状态，通过给定奖励来引导逃避者逃逸；然后在强化学习中引入了势函数，根据追逐者和逃避者的相对势动态调整逃避者的奖励，有效地提高了训练效率。本发明可以应用于多智能体强化学习追逃博弈算法中，实现了逃避者在有限时间内避免多个追逐者的捕获。

技术关键词

多智能体强化学习追逃博弈 DQN算法动作策略仿真模型定义计算机可执行指令加速度可读存储介质参数计算机程序产品仿真环境坐标系表格概念方程决策

系统为您推荐了相关专利信息

基于贝叶斯优化搜索实现DET分支步长优化的方法

分支动态时间规整稳定性检验方法极值核电厂系统

新能源高低电压故障穿越仿真结果偏差计算方法、系统、设备及介质

偏差计算方法仿真模型仿真数据无功电流有功功率

叶片的测试方法、装置、设备及介质

时间段叶片仿真模型计算机执行指令载荷

基于通用性仿真平台的交通系统仿真方法

交通系统仿真平台仿真方法城市道路网络仿真模型

一种基于存算一体的系统级芯片的智能模型的开发系统

节点设备训练智能体资源分配策略任务调度系统级芯片

一种基于多智能体强化学习追逃博弈中的有限时间逃避策略

站点导航

APP 下载