考虑交互的自动驾驶决策规划方法、系统及终端设备

正文

推荐专利

申请号：CN202510048181

申请日期：2025-01-13

公开号：CN120146218A

公开日期：2025-06-13

类型：发明专利

摘要

本发明公开了考虑交互的自动驾驶决策规划方法、系统及终端设备，涉及自动驾驶技术领域。本发明包括：基于安全代价、通行代价和舒适代价设计得到联合代价函数，对联合代价函数进行相反数处理得到联合奖励函数；采用最大熵逆强化学习算法对联合奖励函数进行训练，直至联合奖励函数收敛；根据自车和交互车的状态采样候选联合轨迹，利用收敛后的联合奖励函数对自车和交互车的候选联合轨迹的奖励进行计算；选择奖励最大的候选联合轨迹作为规划结果输出。本发明通过构建集成预测框架，充分考虑了自动驾驶车辆与其他交通车的交互博弈关系，并通过最大熵逆强化学习算法，根据人类驾驶员的专家演示数据，自动地标定集成预测框架的联合奖励函数。

技术关键词

决策规划方法轨迹强化学习算法人类驾驶员深度逆强化学习计算机可执行指令加速度参数终端设备车辆强化学习方法纵向动力学自动驾驶技术处理器规划系统交通车存储器输出模块

系统为您推荐了相关专利信息

一种可再生能源发电功率预测及电力调度方法及系统

可再生能源混合预测模型 Wasserstein距离度量系统运行状态混合整数线性规划

多智能体的可解释性文本心理健康等级评估方法及系统

智能体模型等级评估方法基准多轮对话模型训练模块

工业机器人的空间轨迹处理方法、装置、设备和介质

输入整形器笛卡尔空间轨迹机器人连杆机器人电机工业机器人轨迹

一种惯性测量单元的校准系统和校准方法

加速度校准系统关键点参数指令

服务器机箱及服务器系统

机箱散热口图像数据采集模块图像数据处理模块服务器机箱服务器系统

考虑交互的自动驾驶决策规划方法、系统及终端设备

站点导航

APP 下载