摘要
本发明涉及一种面向室内复杂动态环境的路径规划方法,本发明公开了一种面向室内复杂动态环境的路径规划方法,引入动态扰动优化、自适应探索率调整与优先经验回放机制,提升智能体对动态环境的响应能力与策略稳定性。在家庭、餐馆、图书馆三类典型动态场景下的实验表明,APE‑DPO在路径步数、成功率和收敛速度方面均优于路径规划领域代表性的强化学习模型DQN、DDQN及其变体,部分场景步数减少6.9%至12.5%,展现出良好的鲁棒性与实际应用潜力。
技术关键词
路径规划方法
鲁棒性
强化学习模型
网络结构
误差
参数
动态场景
引导系统
机制
样本
策略
因子
图书馆
时序
速度
决策
模块
系统为您推荐了相关专利信息
预测预警方法
模型库
液压支架
压力
深度学习网络
弱光图像增强方法
频域特征
设计特征
模块
二维离散小波变换
航天器
李雅普诺夫函数
跟踪控制方法
状态观测器
坐标系