基于神经元弹性学习和多Q值策略的路径规划方法

正文

推荐专利

申请号：CN202411858103

申请日期：2024-12-17

公开号：CN119737968A

公开日期：2025-04-01

类型：发明专利

摘要

本发明涉及路径规划技术领域，尤其涉及基于神经元弹性学习和多Q值策略的路径规划方法，包括构建移动机器人在未知环境中的路径规划，以Actor‑Critic网络进行策略学习；初始化ActorNetwork和Critic Network网络参数；通过对ActorNetwork中每一层的神经元进行主次功能区分，删除次神经元并随机赋值，保留主神经元所学；Critic Network中使用多Q值并选择最小的两个Q值取平均作为策略评估目标。本发明提出基于神经元弹性学习和多Q值策略的移动机器人路径规划方法，以解决现有深度强化学习路径规划算法无法在缩小对缓解漂移的修复时间的同时减小Q值高估问题的局限。

技术关键词

路径规划方法策略计算机程序代码移动机器人路径规划技术路径规划系统网络路径规划算法深度强化学习动态障碍物因子处理器墙壁速度数据指令

系统为您推荐了相关专利信息

一种基于数据加密的数据运维存储系统及方法

数据加密决策树模型存储系统加密策略存储管理模块

基于大模型和微调技术实现文物图像修复重建的方法

微调技术数据人工智能技术参数图像处理

一种模块化、高度可定制的机器人控制系统及方法

机器人控制系统分布式控制系统动态路径规划智能驱动模块任务调度

成像控制电路、图像采集装置以及机器人

成像控制电路主控模块补光模块摄像头模块摄像控制模块

一种基于改进黑翅鸢优化算法的无人机任务分配方法

位置更新任务分配模型元启发式算法无人机策略

基于神经元弹性学习和多Q值策略的路径规划方法

站点导航

APP 下载