基于元学习与强化学习的智能船自主避障与目标追踪方法

正文

推荐专利

申请号：CN202411065210

申请日期：2024-08-05

公开号：CN118963362A

公开日期：2024-11-15

类型：发明专利

摘要

本发明公开了一种基于元学习与强化学习的智能船自主避障与目标追踪方法，包括：基于马尔可夫决策过程构建智能船舶在复杂环境下自主避障与目标点追踪任务模型，包括设计符合航海实践的状态空间、动作空间以及奖励函数；基于改进的强化学习算法对模型进行训练，所述改进的强化学习算法为在强化学习算法中引入元强化学习；基于训练后的智能船舶在复杂环境下自主避障与目标点追踪任务模型指导智能船舶动作。本发明基本元任务集进行预训练，提高了模型的训练效率，且元学习方法和基本元任务集对于确定性策略强化学习算法具有较好的通用性。因此本发明不论是对于该智能船舶任务训练的收敛特性，还是面对不同任务的环境适应性，都有提高。

技术关键词

智能船舶强化学习算法自主避障方法无障碍环境追踪方法神经网络参数动作策略学习方法决策坐标障碍物速度频率

系统为您推荐了相关专利信息

边缘计算中模型剪枝方法、装置、电子设备及存储介质

剪枝模型智能搜索算法模型剪枝方法深度学习模型剪枝策略

基于深度强化学习的肝纤维化治疗策略优化系统及其方法

模块通信深度强化学习算法特征数据库蒙特卡洛树肝纤维化治疗

门体损伤检测方法、装置、电子设备及存储介质

仿真模型损伤检测方法门体系统子系统核心

一种物流车辆调度方法及系统

物流车辆调度方法物流车辆调度系统 MapReduce模型 RFID传感器深度强化学习算法

智能废水回收及零排放控制系统

动态贝叶斯网络深度强化学习算法控制系统网络优化策略动态运行状态

基于元学习与强化学习的智能船自主避障与目标追踪方法

站点导航

APP 下载