结合GAIL和PPO的自动驾驶模型训练方法及装置

正文

推荐专利

申请号：CN202510370056

申请日期：2025-03-26

公开号：CN120406192A

公开日期：2025-08-01

类型：发明专利

摘要

本申请实施例提供一种结合GAIL和PPO的自动驾驶模型训练方法及装置，通过设计多阶段训练框架，通过仿真环境采集专家驾驶轨迹序列。构建双分支判别器网络，帧级分支基于注意力机制分析单帧行为特征，轨迹级分支采用循环神经网络处理连续驾驶序列，实现多尺度特征融合。采用近端策略优化算法进行迭代训练，构建多任务学习目标函数同时优化驾驶动作生成和轨迹预测，引入自适应置信区间约束和经验回放机制。该方法有效解决了传统技术在驾驶行为评估、策略优化等方面的不足，显著提升了自动驾驶模型的鲁棒性和泛化能力。

技术关键词

驾驶模型训练方法环境图像信息分支轨迹仿真环境序列策略更新注意力机制多任务多阶段路段残差卷积神经网络训练特征时序多尺度特征融合指令数据

系统为您推荐了相关专利信息

一个基于yolo的动态人流车流检索方法

多线程并行处理动态人流检索方法 YOLO模型视频流

爆破参数选择模型建立方法、系统及参数选择方法

参数优化模型核心模型建立方法遗传算法隧道光面爆破

基于特征交互增强的遥感图像语义分割方法

语义特征 Softmax函数融合多尺度特征图像局部特征注意力机制

一种交互处理方法和电子设备

对象轨迹电子设备交互设备计算机指令集

一种面向语言模型智能客服助理系统的高效持续学习方法

持续学习方法智能客服系统适配器在线学习算法节点

结合GAIL和PPO的自动驾驶模型训练方法及装置

站点导航

APP 下载