摘要
本发明属于多目标路径规划技术领域,尤其涉及一种基于深度强化学习的无人数据收集车多目标路径规划方法,包括以下步骤:S1、将路径规划问题描述为马尔可夫决策过程;构建神经网络模型,用于生成无人数据收集车在环境中的Q值及对应的可执行动作;S2、使用改进后的DDQN算法,对神经网络模型进行参数优化训练;S3、使用参数优化后神经网络模型进行路径规划;S4、使用S3得到的规划路径,控制无人数据收集车按照指定顺序依次访问各个传感器节点进行数据采集。本方法可以为无人数据收集车在复杂多变的环境中为多目标任务实现高效、准确且实时的路径规划。
技术关键词
路径规划方法
深度强化学习
神经网络模型
收集车
数据传输设备
参数
传感器节点
建立栅格地图
障碍物
路径规划技术
中间层
通道
决策
矩阵
终点
系统为您推荐了相关专利信息
状态估计量
故障诊断方法
锂离子电池
剩余使用寿命
非暂态计算机可读存储介质
多头注意力机制
充电站
LSTM模型
数据
滑动窗口
设备健康状态
时间段
发电机组
卷积神经网络模型
功率
周期性特征
序列
长短期记忆网络
建立预测模型
计算机执行指令
自动调控系统
分区
图像采集设备
纹理特征
神经网络模型