一种自动驾驶控制模型确定方法、控制方法、设备及介质

正文

推荐专利

申请号：CN202411062283

申请日期：2024-08-05

公开号：CN118963359A

公开日期：2024-11-15

类型：发明专利

摘要

本申请公开了一种自动驾驶控制模型确定方法、控制方法、设备及介质，涉及强化学习技术领域，将抽取的状态‑动作对输入给训练后的判别器，得出当前状态‑动作对对应的专家额外奖励，之后将专家额外奖励和环境给出的即时奖励共同参与动作价值网络中状态‑动作价值的计算，进而进行策略网络和动作价值网络进行参数更新。由于判别器的训练是基于专家轨迹数据训练得出的，判别器给出的专家额外奖励能够指导智能体更好的向专家轨迹数据的方向进行训练，有利于更快的完成训练过程。判别器的引入应用了模仿学习中的GAIL算法，所以，本发明通过模仿学习和强化学习相结合的方式训练自动驾驶控制模型，提高了自动驾驶控制模型训练的速度。

技术关键词

驾驶控制方法策略轨迹网络 SAC算法数据样本强化学习技术强化学习算法处理器参数先进先出表达式因子计算机设备可读存储介质存储器决策

系统为您推荐了相关专利信息

一种面向多核Chiplet芯片系统的安全总线架构

芯片系统控制策略信号控制器存储芯片中介层

一种基于智能时频分析识别的报靶设备及方法

探测器时频分析技术显示控制终端特征数据库信号

一种基于SerDes高速串行通信链路的信道动态调整方法及系统

速率无干扰神经网络模型信道信号过滤模块

一种基于环境感知的LED车灯智能控制系统及方法

控制策略车灯智能控制系统智能控制方法 LED车灯车灯控制模块

一种面向复杂数据集的二值化目标检测方法

因子光学遥感数据网络通道部署算法

一种自动驾驶控制模型确定方法、控制方法、设备及介质

站点导航

APP 下载