基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统

正文

推荐专利

申请号：CN202410826646

申请日期：2024-06-25

公开号：CN118790287B

公开日期：2025-05-30

类型：发明专利

摘要

本发明涉及一种基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统，其中方法包括以下步骤：建立基于生成式世界大模型的驾驶场景推理模型，预测周围交通参与者的行为，输出未来驾驶场景信息；基于未来驾驶场景信息，利用强化学习算法对智能体进行多步前瞻离线训练，得到最优价值策略网络；基于未来驾驶场景信息和最优价值策略网络，利用蒙特卡洛树搜索在线求解最优决策序列并滚动优化；建立智能网联电动汽车轨迹跟踪控制器，基于最优决策序列控制自动驾驶汽车进行实时轨迹跟踪。与现有技术相比，本发明具有能够实现自动驾驶精准决策、有效提高自动驾驶道路通过效率和安全性等优点。

技术关键词

自动驾驶决策方法蒙特卡洛树搜索轨迹跟踪控制器强化学习算法场景节点车辆序列车道变换策略智能网李雅普诺夫函数图像自动驾驶系统卷积编码器笛卡尔坐标系

系统为您推荐了相关专利信息

一种智能旅游导航系统及方法

智能旅游导航系统导航路径规划社交平台过滤模块数据处理模块

图像审核方法、装置、设备及计算机介质

审核方法文本识别模型计算机程序指令计算机视觉识别文本检测模型

动力电池的检测方法、装置、车辆及存储介质

动力电池等效电路模型参数脉冲数据信号

一种基于AI大模型的互联网集装箱管理部署方法

强化学习模型集装箱管理货运拥堵指数港口管理系统

航空航天核心锻件制造过程中的智能监控与故障诊断系统

故障诊断系统锻件参数非线性变量

基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统

站点导航

APP 下载