基于深度强化学习的AUV船体归坞方法

正文

推荐专利

基于深度强化学习的AUV船体归坞方法

申请号：CN202510750167

申请日期：2025-06-06

公开号：CN120745739A

公开日期：2025-10-03

类型：发明专利

摘要

本发明公开了一种基于深度强化学习的AUV船体归坞方法，包括：s1：实时采集当前状态st，利用当前的参数化策略网络采样动作at，将at的概率密度值记为p(at)；s2：将at代入动力学方程，计算出下一时刻状态st+1和奖励函数rt，组成元组存入经验池；s3：当经验池中元组数量满足条件转s4，否则转s1；s4：将经验池中的st，st+1输入到状态价值网络得到函数值，并计算优势函数，从经验池中采样bs个元组，利用时序差分误差对状态价值网络的参数进行梯度下降，实现策略评估；s5：从经验池中采样bs个元组，引入回滚机制对策略网络的参数进行梯度下降，实现策略改进；s6：AUV满足终止条件结束，否则转s1。

技术关键词

深度强化学习策略船体船坞时序前馈神经网络误差机制超参数方程终端比率因子偏差数据

系统为您推荐了相关专利信息

一种多期扫描影像质量控制方法及装置

分层多模态解剖特征生成解剖结构影像输出单元

基于共享器件的集成电路高效设计方法

标准单元高效设计方法编辑模板集成电路设计技术

基于深度强化学习模型的卫星边缘计算卸载方法、系统及电子设备

深度强化学习模型卫星网络环境神经网络权值决策策略

一种欠驱动船载起重机自适应抗摆控制方法及系统

船用起重机船载起重机非线性神经网络方程台车

结合拉格朗日乘子法与深度学习算法的分布式终端任务卸载和资源分配优化方法

卸载策略资源分配策略服务器终端资源分配优化方法

基于深度强化学习的AUV船体归坞方法

站点导航

APP 下载