摘要
本发明涉及一种基于生成式世界大模型和多步强化学习的自动驾驶决策方法及系统,其中方法包括以下步骤:建立基于生成式世界大模型的驾驶场景推理模型,预测周围交通参与者的行为,输出未来驾驶场景信息;基于未来驾驶场景信息,利用强化学习算法对智能体进行多步前瞻离线训练,得到最优价值策略网络;基于未来驾驶场景信息和最优价值策略网络,利用蒙特卡洛树搜索在线求解最优决策序列并滚动优化;建立智能网联电动汽车轨迹跟踪控制器,基于最优决策序列控制自动驾驶汽车进行实时轨迹跟踪。与现有技术相比,本发明具有能够实现自动驾驶精准决策、有效提高自动驾驶道路通过效率和安全性等优点。
技术关键词
自动驾驶决策方法
蒙特卡洛树搜索
轨迹跟踪控制器
强化学习算法
场景
节点
车辆
序列
车道变换
策略
智能网
李雅普诺夫函数
图像
自动驾驶系统
卷积编码器
笛卡尔坐标系
系统为您推荐了相关专利信息
智能旅游导航系统
导航路径规划
社交平台
过滤模块
数据处理模块
审核方法
文本识别模型
计算机程序指令
计算机视觉识别
文本检测模型
强化学习模型
集装箱管理
货运
拥堵指数
港口管理系统