自动驾驶决策模型训练方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202410891617

申请日期：2024-07-04

公开号：CN118607621A

公开日期：2024-09-06

类型：发明专利

摘要

本发明公开了一种自动驾驶决策模型训练方法、装置、设备、介质及产品，其方法包括：初始化决策模型以及用于表示强交互场景的环境状态s；基于环境状态s，使用决策模型计算所有可能的决策期望值，并筛选出一个决策期望值，根据决策期望值确定对应的动作a；在环境状态s中，执行动作a，得到反馈的新的环境状态s'以及奖励函数r；基于环境状态s’以及奖励函数r生成经验元组(s,a,s’,r)，并将环境状态s’重新输入决策模型中，重复上述步骤生成新的经验元组，循环多次最终生成多组经验元组组成经验回放合集D；以及，将经验回放合集D作为训练样本训练决策模型。本发明可以训练得到车辆在强交互场景下的决策模型以用于车辆决策控制。

技术关键词

驾驶决策模型决策方法计算机可执行指令标签场景分类数据训练装置车辆贪心算法计算机程序产品处理器通信网络结构识别模块存储模块可读存储介质

系统为您推荐了相关专利信息

一种基于图像OAR模型的态势核心要素检索方法

三元组检索方法标签全局特征融合核心

基于大数据分析的电商智能运营监控与协同决策方法

决策方法斯塔克尔伯格博弈动态知识图谱节点时间序列特征

一种融合RPA与AI技术的电力营销售电数据收集方法

数据收集方法 BERT模型结构化数据格式文本电力

道路异常事件实时监测与告警系统

异常事件注意力神经网络告警系统节点应急响应系统

基于数据分析的流程执行效率调整方法及装置

计算机可执行指令节点参数仪表盘检查点

自动驾驶决策模型训练方法、装置、设备、介质及产品

站点导航

APP 下载