一种基于宽度强化学习的水下机器人实时路径规划方法

正文

推荐专利

申请号：CN202411603774

申请日期：2024-11-12

公开号：CN119124175B

公开日期：2025-04-15

类型：发明专利

摘要

一种基于宽度强化学习的水下机器人实时路径规划方法，包括：建立水下机器人仿真环境；将水下机器人实时路径规划问题建模为马尔可夫决策过程；构建宽度评价网络和宽度目标网络，并初始化参数；设计先验策略指导水下机器人进行动作的选择；计算上一时刻环境状态下动作作用后的奖励，得到完整经验并存入经验池；基于经验池中的样本，定义损失函数，以共轭梯度法进行宽度网络参数的更新；每隔预定时间更新宽度目标网络，直至完成训练。本发明基于宽度强化学习方法，降低了计算复杂度，设计先验策略指导机器人进行学习，具有训练速度快、计算量小的特点，适用于水下机器人的实时路径规划任务。

技术关键词

水下机器人障碍物路径规划方法网络仿真环境矩阵节点测距传感器坐标系强化学习方法波束贪心策略决策非线性定义速度

系统为您推荐了相关专利信息

结合神经网络模型和Hashcat的混合口令破解方法

口令神经网络模型掩码规则规模字典

基于时空超图四重注意力网络的股票趋势预测方法、系统及电子设备

股票趋势预测方法网络数据挖掘技术基金矩阵

一种多机器人协同路径规划方法、系统及存储介质

协同路径规划方法人工势场法 DQN算法多机器人协同动作策略

基于改进YOLOv8的手机屏幕玻璃缺陷检测方法

缺陷检测方法缺陷类别图像采集平台工业生产环境检测网络模型

基于多合一天线技术的智能工厂无线通信系统及其方法

无线通信方法信道状态信息智能工厂射频连接器优化无线资源

一种基于宽度强化学习的水下机器人实时路径规划方法

站点导航

APP 下载