摘要
本发明公开了一种基于快慢系统的人机共融的自动驾驶决策方法,旨在兼顾自动驾驶场景下安全性、灵活性和可控性。该模型由基于深度强化学习的快系统和基于大语言模型的慢系统共同构成:其中,快系统负责实时驾驶决策与控制,能够在短时高频的动态交通环境中快速响应;慢系统通过理解并解析人类用户的指令,结合环境感知信息做出高层次决策和目标车道选择,并将该信息传递给快系统执行。通过在快系统的观测空间中引入目标车道与人类指令信息,并设计相应的网络结构及奖励函数,系统能够在保证安全驾驶的同时,听从人类指令,实现“人机共融”自动驾驶。本发明具有良好的通用性、可扩展性及可解释性。
技术关键词
自动驾驶决策方法
深度强化学习
车辆
环境状态信息
指令
大语言模型
周边环境状态
车载人机交互
动态交通环境
高层次
环境感知信息
策略
多模态传感器
人类
自然语言理解
车道线信息
车道中心线
系统为您推荐了相关专利信息
电池系统
继电器控制方法
等效电路模型
支路
环流
势场法避障
车辆行驶控制
路径搜索算法
环卫车辆
计算机可读程序
多雷达协同探测
多智能体深度强化学习
多雷达系统
节点
指标
应用程序编程接口
关系
计算机程序技术
生成有向无环图
网络