摘要
本发明提供一种基于分布式强化学习的无人艇风险自适应导航算法,包括以下步骤:构建无人艇模型、建立动态洋流环境模型;利用分布式强化学习来解决动态环境下具有感知不确定性的无人艇自主导航问题,分布式强化学习相比于强化学习可以保留更多信息,在不确定情况下能更好的学习策略,对稀疏奖励任务有很好的性能提升;针对环境不确定性进一步提出了具有自适应风险倾向的隐式分位数网络,增强风险评估和风险意识决策的能力,降低碰撞发生率,确保航行安全。本发明提供的一种基于分布式强化学习的无人艇风险自适应导航算法,采用了分布式强化学习方法解决无人艇在不确定环境下基于传感器的导航问题。
技术关键词
分布式强化学习
无人艇
风险
导航算法
矢量计算方法
模拟海洋环境
仿真环境
三自由度运动
定义
障碍物
强化学习算法
贪心策略
动态
决策
旋涡
网络
度量
速度
系统为您推荐了相关专利信息
环境监测设备
实时监测方法
卷积神经网络模型
数据
哮喘