多无人机最优博弈受限加速强化学习控制方法及装置

正文

推荐专利

申请号：CN202510938915

申请日期：2025-07-08

公开号：CN120779739A

公开日期：2025-10-14

类型：发明专利

摘要

本发明提供一种多无人机最优博弈受限加速强化学习控制方法及装置，涉及加速强化学习技术领域。该方法包括：构建评判神经网络，逼近带双曲线正切函数和博弈邻居项的性能指标函数、无人机的最优受限控制输入和无人机最坏情况下的受限控制输入；基于上述输入参数，构建哈密尔顿‑雅可比误差方程；通过误差方程，构建包含当前信息和过去信息的带调节参数的求和平方误差；设计评判神经网络的权值更新律；根据权值更新律，计算下一次迭代的权值；求解相邻两次迭代权值的误差，并与预设阈值进行比较，若误差小于预设的阈值，停止迭代，输出逼近分布式无人机系统最优博弈一致控制问题的解。采用本发明可提升无人机之间的协作效率。

技术关键词

强化学习控制方法受限多无人机误差神经网络权值学习控制设备计算机可读取存储介质学习控制装置无人机系统计算机可读指令邻居方程矩阵强化学习技术参数双曲正切函数处理器存储器代表

多无人机最优博弈受限加速强化学习控制方法及装置

站点导航

APP 下载