摘要
本发明提供了一种基于大型语言模型的自主无人车训练方法及系统,属于自动驾驶和人工智能领域。它解决了技术中奖励函数设计效率低且难以适应不同场景的问题。本基于大型语言模型的自主无人车训练方法及系统验证了所提出的无人车自主训练框架的性能,实验结果表明,利用本发明生成的奖励函数训练得到的驾驶策略,在路径规划成功率、行驶效率以及车距保持稳定性等指标上均优于人工设计的奖励函数。同时,本发明训练得到的策略展现出了良好的泛化能力,在不同评估环境下仍能保持稳健表现。本发明训练得到的策略展现出了良好的泛化能力,在不同评估环境下仍能保持稳健表现。
技术关键词
无人车
深度强化学习算法
进化算法
策略
搜索模块
神经网络架构
训练系统
仿真环境
自然语言
人类
超参数
闭环
文本
规划
样本
指标
场景