基于深度强化学习的搜索路径规划方法、装置及评估方法

正文

推荐专利

申请号：CN202510627031

申请日期：2025-05-15

公开号：CN120146358B

公开日期：2025-08-01

类型：发明专利

摘要

本申请涉及搜索路径规划技术领域，具体涉及一种基于深度强化学习的搜索路径规划方法、装置及评估方法。该搜索路径规划方法包括以下步骤：基于搜索环境参数，建立关于探测能力的环境矩阵，并设定起点；已训练好的神经网络基于智能体的当前位置、奖励函数和环境矩阵，输出各动作对应的Q值，所述奖励函数根据当前位置及其与目标点的距离、当前位置邻域的探测能力以及未访问区域数量设计；智能体根据Q值最大对应的动作执行每下一步动作。能够解决现有技术中存在强化学习算法在面对复杂任务时往往难以同时兼顾效率与稳定性，可能导致路径规划时间过长或结果偏离全局最优，影响实际应用效果的问题。

技术关键词

路径规划方法深度强化学习邻域矩阵覆盖率路径规划技术路径规划装置神经网络参数强化学习算法误差效能索引代表方程模块因子标记

系统为您推荐了相关专利信息

负荷识别模型训练方法、装置、计算机设备、可读存储介质和程序产品

负荷特征矩阵标签识别模型训练计算机设备

一种供应链聚合服务平台

销售管理模块风险渠道全过程管理物联网设备

一种光储系统的无功补偿方法、系统及设备

光储系统无功补偿方法数据采集层气象监测数据神经网络架构

一种电力负荷数据缺失值修复方法、装置及存储介质

电力系统负荷数据数据缺失值修复方法牛顿插值法序列

基于图像处理的电力施工电缆铺设路径优化方法及系统

电力施工电缆路径优化方法连续特征多角度矩阵

基于深度强化学习的搜索路径规划方法、装置及评估方法

站点导航

APP 下载