基于深度强化学习的无人车规划方法及装置

正文

推荐专利

基于深度强化学习的无人车规划方法及装置

申请号：CN202411809033

申请日期：2024-12-10

公开号：CN120013102A

公开日期：2025-05-16

类型：发明专利

摘要

本发明提供一种基于深度强化学习的无人车规划方法及装置，方法包括：获取待测网络性能信息和待测观测状态信息；将待测网络性能信息和待测观测状态信息输入至无人车调度预测模型中，得到无人车调度预测模型输出的无人搬运车的预测动作；其中，无人车调度预测模型是基于经验回放池中的训练样本数量达到第一预设数量后、从经验回放池中选择第二预设数量的训练样本进行优化训练得到的，经验回放池中的训练样本是根据对应时间步数的历史观测状态、历史网络性能信息、基于历史观测状态选择的历史动作以及执行所选历史动作后基于历史网络性能信息得到的下一历史观测状态和历史奖励得到的。本发明能确保及时捕捉状态变化，提高了动作预测的准确性。

技术关键词

网络性能信息无人车深度强化学习无人搬运车规划预测模型训练梯度下降算法速度贪心策略参数计算机程序产品处理器传播算法误差存储器因子电子设备模块标记

系统为您推荐了相关专利信息

一种干细胞自动化制备的机械臂运动规划方法

无碰撞运动表达式模糊隶属度方法插值模型算法规划

一种基于A星算法的移动机器人多任务点位路径规划方法及相关设备

移动机器人路径规划方法 A星算法构建环境地图多任务

一种加工阶段云边协同驱动的钢筋模型轻量化设计平台

分布式任务调度钢筋接口模块动态资源调度云端

一种无线边缘算力网络中任务预编码和资源分配优化方法

多智能体深度强化学习资源分配优化方法多智能体强化学习网络系统架构编码策略

一种多机器人协同的建筑作业方法及系统

建筑作业方法建筑三维模型多机器人协同动态障碍物强化学习模型

基于深度强化学习的无人车规划方法及装置

站点导航

APP 下载