一种基于最大熵强化学习的多无人艇目标搜索方法

正文

推荐专利

申请号：CN202510844263

申请日期：2025-06-23

公开号：CN120745741A

公开日期：2025-10-03

类型：发明专利

摘要

本发明涉及无人艇领域，具体涉及一种基于最大熵强化学习的多无人艇目标搜索方法，包括：初始化策略网络和价值网络，并设置目标价值网络；无人艇根据当前策略网络在当前状态下采样无人艇的当前动作，执行当前动作与环境交互，通过建立的部分可观测马尔科夫决策模型中设计的奖励函数，得到奖励、下一个时刻状态以及终止信息，并存储到经验回放缓冲区；从经验回放缓冲区随机采样一部分经验，计算目标值；通过目标值更新价值网络参数和策略网络参数；引入额外的损失函数，更新熵调节参数；更新目标价值网络的参数；判断目标价值网络当前的参数与前一个参数差值的绝对值是否小于阈值。通过本方法，提高了无人艇在复杂环境下的搜索效率。

技术关键词

搜索方法网络策略参数梯度下降法多无人艇决策速度定义障碍物坐标系速率强度运动流速算法元素误差

系统为您推荐了相关专利信息

基于BIM动态雨洪模拟的雨水花园优化方法及系统

管网拓扑关系动态参数覆盖率径流

生物质气化炉自动给料方法及系统

生物质气化炉自动给料模糊控制算法神经网络算法金属探测器

协作机器人的控制系统、方法、电子设备及存储介质

协作机器人协作策略视觉相机图像工件

一种面向ARMv8架构的二维三维Winograd卷积优化方法及系统

Winograd卷积数据人工智能神经网络矩阵融合算法

一种基于AI技术的数据监测预警方法及系统

数据监测预警监督学习框架文本情感分析预警机制网络分析

一种基于最大熵强化学习的多无人艇目标搜索方法

站点导航

APP 下载