摘要
本发明公开了一种智能可解释的交通信号自适应控制方法,包括:根据交叉路口的环境状态信息通过强化学习对智能体进行训练;并用智能体生成交叉路口各相位的配时决策;将配时决策和提示词引导第一大语言模型生成预训练数据对第二大语言模型进行LoRA微调,将提示词输入微调后的第二大语言模型使第二大语言模型生成多个推理轨迹生成正样本和负样本;对第二大语言模型进行全参数微调得到交通控制信号决策模型;将构建的提示词输入交通控制信号决策模型得到交叉路口的各相位配时方案。本发明弥补了基于深度强化学习的智能交通信号控制算法缺乏可解释性以及跨场景泛化能力差的弊端,对提高决策的可信度以及部署效率具有重要意义。
技术关键词
大语言模型
环境状态信息
远程监控程序
决策
网络
样本
轨迹
计算机存储介质
智能交通信号
交通信号优化
参数
深度强化学习
车辆
数据
车道
处理器
交叉口
矩阵