摘要
本发明公开了一种基于深度确定性梯度策略的月球车路径规划方法,通过将距离奖励、瞬时进展奖励、瞬时航向奖励和运动平滑性奖励,构建动态多维度奖励函数机制,通过地形特征动态调节权重系数,实现多目标自适应协同;通过在不同风险地形中动态调整步长,提升月球车在不同地形下的避障精度和自主探索能力;通过动态多维度奖励函数、轻量化网络结构及自适应调整步长策略的多层次自适应机制,避免局部最优,提升路径连续性,完成月球车自主决策探测任务,实现路径规划效率与运动安全性的双重提升,解决传统强化学习在复杂月面环境中存在的收敛速度慢、路径震荡频繁、地形适应性差及模型部署效率低等核心问题,降低模型复杂度和减少对地图的依赖。
技术关键词
路径规划方法
月球车位置
平滑度
策略
动态
粗糙度
转向角
地形特征
路径规划效率
复杂度
月面环境
风险
噪声
栅格
车辆车轮
速度
系统为您推荐了相关专利信息
波束综合方法
分布式阵列
进化算法
遗传算法
计算方法
测绘方法
指纹
HTTP请求
语义特征提取
前馈神经网络
台区线损
样本
动态变化规律
模型评测方法
多层感知机
智能机器人
优化通信模式
优化通信方法
通信历史数据
网络拥塞程度