一种自动驾驶控制模型确定方法、控制方法、设备及介质

AITNT
正文
推荐专利
一种自动驾驶控制模型确定方法、控制方法、设备及介质
申请号:CN202411062283
申请日期:2024-08-05
公开号:CN118963359A
公开日期:2024-11-15
类型:发明专利
摘要
本申请公开了一种自动驾驶控制模型确定方法、控制方法、设备及介质,涉及强化学习技术领域,将抽取的状态‑动作对输入给训练后的判别器,得出当前状态‑动作对对应的专家额外奖励,之后将专家额外奖励和环境给出的即时奖励共同参与动作价值网络中状态‑动作价值的计算,进而进行策略网络和动作价值网络进行参数更新。由于判别器的训练是基于专家轨迹数据训练得出的,判别器给出的专家额外奖励能够指导智能体更好的向专家轨迹数据的方向进行训练,有利于更快的完成训练过程。判别器的引入应用了模仿学习中的GAIL算法,所以,本发明通过模仿学习和强化学习相结合的方式训练自动驾驶控制模型,提高了自动驾驶控制模型训练的速度。
技术关键词
驾驶控制方法 策略 轨迹 网络 SAC算法 数据 样本 强化学习技术 强化学习算法 处理器 参数 先进先出 表达式 因子 计算机设备 可读存储介质 存储器 决策
系统为您推荐了相关专利信息
1
一种面向多核Chiplet芯片系统的安全总线架构
芯片系统 控制策略 信号控制器 存储芯片 中介层
2
一种基于智能时频分析识别的报靶设备及方法
探测器 时频分析技术 显示控制终端 特征数据库 信号
3
一种基于SerDes高速串行通信链路的信道动态调整方法及系统
速率 无干扰 神经网络模型 信道 信号过滤模块
4
一种基于环境感知的LED车灯智能控制系统及方法
控制策略 车灯智能控制系统 智能控制方法 LED车灯 车灯控制模块
5
一种面向复杂数据集的二值化目标检测方法
因子 光学遥感数据 网络 通道 部署算法
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号