摘要
基于增量正则化网络的自主水下航行器控制方法和系统,属于智能控制技术领域,解决传统的路径规划算法在面对复杂环境时,容易出现计算效率低下和实时性不足问题。本发明的方法包括:在利用历史数据训练深度强化学习模型时引入L2正则化方法,快速实现路径的实时规划;引入增量路径动态决策机制,提取所训练的深度强化学习模型的参数,按批次对模型参数进行LoRA微调,使模型能够在自主水下航行器的运动过程中动态更新其Q值函数。基于深度强化学习方法,为自主水下航行器设计增量路径决策网络,使其在运动过程中根据获取到的新信息进行增量决策。本发明适用于复杂环境下自主水下航行器的自主路径规划。
技术关键词
自主水下航行器
深度Q网络
决策网络模型
增量更新
正则化方法
微调技术
参数
深度强化学习模型
规避动态障碍物
矩阵
深度强化学习方法
代表
数据中心
自主路径规划
系统为您推荐了相关专利信息
组网分析方法
矩阵
智能系统
拉普拉斯
数值计算方法
网络流量调度方法
深度强化学习模型
深度Q网络
遮蔽方法
回溯方法
智能接口装置
变电站保护设备
断路器保护装置
母线保护装置
过渡方法
资源检索方法
中文学习机
协同过滤算法
强化学习算法
深度学习算法