一种基于最大熵强化学习的多无人艇目标搜索方法

AITNT
正文
推荐专利
一种基于最大熵强化学习的多无人艇目标搜索方法
申请号:CN202510844263
申请日期:2025-06-23
公开号:CN120745741A
公开日期:2025-10-03
类型:发明专利
摘要
本发明涉及无人艇领域,具体涉及一种基于最大熵强化学习的多无人艇目标搜索方法,包括:初始化策略网络和价值网络,并设置目标价值网络;无人艇根据当前策略网络在当前状态下采样无人艇的当前动作,执行当前动作与环境交互,通过建立的部分可观测马尔科夫决策模型中设计的奖励函数,得到奖励、下一个时刻状态以及终止信息,并存储到经验回放缓冲区;从经验回放缓冲区随机采样一部分经验,计算目标值;通过目标值更新价值网络参数和策略网络参数;引入额外的损失函数,更新熵调节参数;更新目标价值网络的参数;判断目标价值网络当前的参数与前一个参数差值的绝对值是否小于阈值。通过本方法,提高了无人艇在复杂环境下的搜索效率。
技术关键词
搜索方法 网络 策略 参数 梯度下降法 多无人艇 决策 速度 定义 障碍物 坐标系 速率 强度 运动 流速 算法 元素 误差
系统为您推荐了相关专利信息
1
基于BIM动态雨洪模拟的雨水花园优化方法及系统
管网拓扑关系 动态 参数 覆盖率 径流
2
生物质气化炉自动给料方法及系统
生物质气化炉 自动给料 模糊控制算法 神经网络算法 金属探测器
3
协作机器人的控制系统、方法、电子设备及存储介质
协作机器人 协作策略 视觉相机 图像 工件
4
一种面向ARMv8架构的二维三维Winograd卷积优化方法及系统
Winograd卷积 数据 人工智能神经网络 矩阵 融合算法
5
一种基于AI技术的数据监测预警方法及系统
数据监测预警 监督学习框架 文本情感分析 预警机制 网络分析
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号