摘要
本发明公开了一种基于元学习与强化学习的智能船自主避障与目标追踪方法,包括:基于马尔可夫决策过程构建智能船舶在复杂环境下自主避障与目标点追踪任务模型,包括设计符合航海实践的状态空间、动作空间以及奖励函数;基于改进的强化学习算法对模型进行训练,所述改进的强化学习算法为在强化学习算法中引入元强化学习;基于训练后的智能船舶在复杂环境下自主避障与目标点追踪任务模型指导智能船舶动作。本发明基本元任务集进行预训练,提高了模型的训练效率,且元学习方法和基本元任务集对于确定性策略强化学习算法具有较好的通用性。因此本发明不论是对于该智能船舶任务训练的收敛特性,还是面对不同任务的环境适应性,都有提高。
技术关键词
智能船舶
强化学习算法
自主避障方法
无障碍环境
追踪方法
神经网络参数
动作策略
学习方法
决策
坐标
障碍物
速度
频率
系统为您推荐了相关专利信息
剪枝模型
智能搜索算法
模型剪枝方法
深度学习模型
剪枝策略
模块通信
深度强化学习算法
特征数据库
蒙特卡洛树
肝纤维化治疗
物流车辆调度方法
物流车辆调度系统
MapReduce模型
RFID传感器
深度强化学习算法
动态贝叶斯网络
深度强化学习算法
控制系统
网络优化策略
动态运行状态