摘要
本发明提供基于PPO‑CA的矿山机器人搜救路径自适应优化模型构建方法,属于矿山应急救援领域。本发明包含:首先,通过三维运动模型导航、三维声纳波形处理和三维视觉传感器图像分析三种技术的融合,构建矿山搜救机器人自主地形感知与避障模型;其次,依据马尔科夫决策模型,构建出一条包括系统状态、行为和奖励函数的运动轨迹,通过蒙特卡洛近似期望法得到梯度的近似值;然后,通过A2C算法优化梯度计算,引入重要性采样提高数据的利用率;最后,采用近端策略优化裁切的注意力机制算法(Proximal Policy Optimization Clip Attention,PPO‑CA),使目标函数的更新更加稳定,通过策略参数的不断迭代,最终得到矿山机器人搜救路径自适应优化模型,更好的满足实际应用场景。
技术关键词
策略
模型构建方法
搜救机器人
参数
轨迹
蒙特卡洛法
三维视觉传感器
注意力机制算法
矿山应急救援
复杂多变环境
引入注意力机制
矿山环境
决策
运动
图像分析
系统为您推荐了相关专利信息
术后并发症
模型构建方法
层级
支持向量机SVM方法
交互建模方法
数据协同传输方法
分片
节点
传输路径
生成哈希值
异常事件
故障预警方法
故障特征
消防设备
依赖关系分析
自动化管理系统
故障运行状态
智能配电网
配电网设备
历史运行数据
数据分布方法
硬件设备
众核环境
参数
数据分布装置