自动驾驶决策模型训练方法、装置、设备、介质及产品

AITNT
正文
推荐专利
自动驾驶决策模型训练方法、装置、设备、介质及产品
申请号:CN202410891617
申请日期:2024-07-04
公开号:CN118607621A
公开日期:2024-09-06
类型:发明专利
摘要
本发明公开了一种自动驾驶决策模型训练方法、装置、设备、介质及产品,其方法包括:初始化决策模型以及用于表示强交互场景的环境状态s;基于环境状态s,使用决策模型计算所有可能的决策期望值,并筛选出一个决策期望值,根据决策期望值确定对应的动作a;在环境状态s中,执行动作a,得到反馈的新的环境状态s'以及奖励函数r;基于环境状态s’以及奖励函数r生成经验元组(s,a,s’,r),并将环境状态s’重新输入决策模型中,重复上述步骤生成新的经验元组,循环多次最终生成多组经验元组组成经验回放合集D;以及,将经验回放合集D作为训练样本训练决策模型。本发明可以训练得到车辆在强交互场景下的决策模型以用于车辆决策控制。
技术关键词
驾驶决策模型 决策方法 计算机可执行指令 标签 场景分类 数据 训练装置 车辆 贪心算法 计算机程序产品 处理器通信 网络结构 识别模块 存储模块 可读存储介质
系统为您推荐了相关专利信息
1
一种基于图像OAR模型的态势核心要素检索方法
三元组 检索方法 标签 全局特征融合 核心
2
基于大数据分析的电商智能运营监控与协同决策方法
决策方法 斯塔克尔伯格博弈 动态知识图谱 节点 时间序列特征
3
一种融合RPA与AI技术的电力营销售电数据收集方法
数据收集方法 BERT模型 结构化数据格式 文本 电力
4
道路异常事件实时监测与告警系统
异常事件 注意力神经网络 告警系统 节点 应急响应系统
5
基于数据分析的流程执行效率调整方法及装置
计算机可执行指令 节点 参数 仪表盘 检查点
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号