摘要
本发明公开了一种强化学习与领域知识融合的无人艇集群路径规划方法,包括以下步骤:1)搭建无人艇集群路径规划模型训练场景环境;2)建立无人艇路径规划模型;初始化每个无人船路径规划的深度网络θk和深度网络Φk;3)对网络θk进行预训练;步骤4)对无人艇路径规划模型进行训练;5)对更新后无人船集群路径规划模型进行效果评估,若效果满足无人船集群路径规划需求,则结束无人船集群路径规划模型训练,得到预训练好的无人船集群路径规划模型;6)使用训练完成的无人船集群路径规划模型解决无人船集群路径规划。本发明方法引入了先验知识进行模型预训练,降低了模型的解空间复杂度;同时为模型的更新提供了引导,保证了效果的稳定性。
技术关键词
无人船集群
无人艇集群
动态障碍物
路径规划方法
无人艇路径规划
静态障碍物
训练场景
无人船路径规划
路径规划系统
专家系统
缓冲器
三维重建技术
神经网络结构
人工势场法
模型预训练
策略更新