基于深度强化学习的水下航行器自动避障策略训练方法

AITNT
正文
推荐专利
基于深度强化学习的水下航行器自动避障策略训练方法
申请号:CN202411817894
申请日期:2024-12-11
公开号:CN119336032B
公开日期:2025-04-04
类型:发明专利
摘要
一种基于深度强化学习的水下航行器自动避障策略训练方法,首先构建水下航行器的物理与动力学模型、世界与随体坐标系,然后构建基于Gym的算法环境,并定义其状态空间、动作空间、奖励函数和结束条件,接着利用四元数变换更新位置与状态空间的参数,然后基于算法环境,利用深度强化学习算法进行训练,获得避障神经网络模型,最后基于该模型,实施避障策略;在应用中,通过构建水下航行器的物理与动力学模型,以准确反映复杂环境,并结合两种坐标系,直观描述航行器的位置和姿态,然后利用深度强化学习,学习复杂避障策略,使其能够扩展到三维空间自动路径规划等任务场景中,以便在未知环境中自主制定导航与避障策略。因此,本发明的适用范围较广。
技术关键词
水下航行器 障碍物 坐标系 深度强化学习算法 人工智能算法 神经网络模型 表达式 策略 传感器 方向舵 自动路径规划 参数 物理 矩阵 误差 直线 方程 尾舵
系统为您推荐了相关专利信息
1
一种无人艇上的多波束声呐高效滤波与畸变剔除方法、程序、设备及存储介质
波束 剔除方法 换能器 声呐 滤波算法
2
一种智慧工地项目中的塔机监控系统
智慧工地 疲劳寿命预测 三维动态模型 时空卷积神经网络 多模态传感器
3
基于模型与视频融合的资产管理方法、装置及存储介质
资产管理方法 顶点 实物资产 纹理 时间序列预测模型
4
一种考虑清渣区域人员预警的TBM清渣机器人的清渣路径规划方法及清渣系统、计算机装置
路径规划方法 机器人 静态障碍物 动态障碍物 轨迹预测模型
5
全向可动射电望远镜副面调整机构全仰角误差补偿方法
射电望远镜 误差补偿方法 位姿误差 机构运动学 平台
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号