摘要
本发明公开了基于逆强化学习的多模态场景驾驶行为建模方法及系统,涉及智能驾驶技术领域,通过自监督对比学习算法基于模型参数对训练数据的场景进行分类,输出每个训练数据对应的场景标签。以相同场景标签的数据为一组,再次循环“逆强化学习‑场景聚类”过程,直到得到稳定的“模型参数‑训练数据”配对。使用“模型参数‑训练数据”配对训练全局代价函数,使其能根据车辆的状态判断其对应的场景并输出对应的模型参数。解决了目前将逆强化学习应用于智能驾驶中的驾驶行为建模方法由于受到线性奖励函数的限制,无法适应复杂的混编交互场景的问题。
技术关键词
轨迹
场景
建模方法
数据
参数
建模系统
子模块
聚类算法
智能驾驶技术
输出模块
标签
学习算法
线性
车辆
系统为您推荐了相关专利信息
电网负荷预测
调度优化系统
数据采集层
电力系统自动化技术
设备状态传感器
智能推荐方法
机器学习模型
智能推荐系统
铆钉
深度学习模型
调配优化方法
应急物资调度
遥感影像数据
路段
Dijkstra算法