马尔科夫决策过程模型训练方法及轨迹规划方法

正文

推荐专利

申请号：CN202411926036

申请日期：2024-12-25

公开号：CN119849588A

公开日期：2025-04-18

类型：发明专利

摘要

本发明公开了一种马尔科夫决策过程模型训练方法及轨迹规划方法，包括：获取车辆周围的道路交通信息，并根据所述道路交通信息决策出所述车辆的行驶状态；根据所述行驶状态，构建马尔科夫决策过程模型，所述马尔科夫决策过程模型包括状态空间、动作空间、多车网络共享的DQN神经网络以及奖励函数，所述DQN神经网络用于基于所述状态空间从所述动作空间中选择最优的状态动作值来对所述车辆进行控制，得到所述车辆的轨迹规划策略，所述奖励函数用于量化所述轨迹规划策略的性能；通过将多个车辆采集到的经验放入网络经验池，所述DQN神经网络通过随机采样的方式从经验池中采样进行经验回放并更新神经网络参数。

技术关键词

道路交通信息车辆轨迹规划模型训练方法决策动态轨迹规划方法神经网络参数车道转移概率矩阵拥堵状况贪婪策略交通信号灯因子更新方法加速度

系统为您推荐了相关专利信息

一种跨部门协作效能动态优化系统及方法

动态优化方法机器学习模型动态优化系统效能压力

基于重力加视觉的AI智能货柜结算方法和装置

智能货柜结算方法视觉重力动态规划算法

一种波纹管缺陷速检方法及设备

缺陷预测方法多时间尺度结构方程模型生成多尺度节点

一种外语文章写作辅助方法及系统

写作辅助方法样本意图识别大语言模型文章

一种智能灌溉动态决策方法及设备

归一化植被指数地表温度数据动态决策方法日期矢量掩膜

马尔科夫决策过程模型训练方法及轨迹规划方法

站点导航

APP 下载