摘要
一种可控可解释的自动驾驶方法与系统,智能车从历史驾驶行为和环境反馈中归纳生成出策略,通过这些策略可以控制决策。系统包含认知模型、决策模型和价值模型。认知模型接受环境的输入,决定使用何种策略,并且此模型可以通过决策后效果或者历史驾驶行为进行策略的归纳。决策模型接受环境的输入和认知模型输出的策略并进行决策,决策后执行,由环境反馈进行学习。价值模型用来判断当前驾驶状态什么决策是好的,进而帮助决策模型学习。由此系统可以自生成认知驾驶策略,并通过驾驶策略控制决策。
技术关键词
驾驶环境信息
自动驾驶方法
决策
人工神经网络
策略
误差反向传播
自动驾驶系统
误差函数
算法
阶段
处理器
序列
场景
代表
物理
车辆
模式
系统为您推荐了相关专利信息
协同优化方法
网络探针
时空分布特征
强度
特征融合网络
演播系统
深度学习系统
预训练模型
推理系统
模拟键盘鼠标
泡沫混凝土
数字孪生模型
分析系统
承压水
分析模块
中药材智能
分拣机器人
短波红外探测器
虚拟仪器
分拣机械臂