摘要
本发明涉及一种融合注意力机制的双深度Q网络动态路径规划方法,属于路径规划技术领域。本发明通过改进DDQN算法,结合注意力机制和自适应奖励机制,提出了一种适用于复杂动态环境的路径规划方法。该方法包括以下创新点:1)引入自适应奖励机制,动态调整路径长度、碰撞规避和能耗的权重,确保路径规划的安全性和效率;2)在网络结构中嵌入注意力机制,增强对关键环境信息的聚焦能力,提升决策精度;3)采用优先级经验回放策略,加速模型收敛;4)设计动态探索策略,根据训练进度自适应调整探索率。本发明能够有效提升路径规划的效率和质量,适用于自动驾驶、机器人导航等动态环境中的路径规划任务。
技术关键词
动态路径规划方法
融合注意力机制
深度Q网络
方格
引入注意力机制
路径规划技术
双网络结构
策略
障碍物
样本
梯度下降法
决策
栅格
系统为您推荐了相关专利信息
动态路径规划方法
深度强化学习
路径规划器
表征场景
动态障碍物
无人小车
裂纹检测系统
裂纹检测方法
量子遗传算法
扩散方程模型
多模态深度学习
遥感反演方法
双波段
因子
DNN模型
精准筛查方法
人工神经网络
筛查模型
深度Q网络学习
对象
身份识别方法
深度网络模型
动物
特征数据库
度量