摘要
本发明公开了一种水下滑翔机攻角的深度强化学习决策方法,属于水下滑翔机技术领域。本发明以滑翔机采样的深度、俯仰角、航向角为数据基础,建立包含动态攻角信息的航位推算环境动力,将深度强化学习智能体纳入航位推算过程实现攻角的自主推理,并设计基于航位推算与实测卫星定位坐标误差的奖励系统,最终实现基于攻角动态智能决策的精准水下滑翔机航位推算及速度估计。本发明可为水下滑翔机海流观测等依赖滑翔机速度参考的观测任务提供高分辨、精度改善的水下滑翔机速度信息参考。
技术关键词
深度强化学习
卫星定位坐标
决策方法
决策系统
水下滑翔机技术
强化学习框架
奖励系统
推理系统
参数
速度估计
因子
网络结构
误差
标志位
数据
系统为您推荐了相关专利信息
深度强化学习
时间敏感网络
异构设备
异构网络环境
策略
智能窗
空气质量指数
智能决策方法
控制策略
智能决策系统
车辆路径规划方法
深度强化学习
客户
融合策略
代表
马斯洛需求层次理论
小区
综合评价体系
模拟退火算法
改造智能