摘要
本申请属于交通控制系统技术领域,具体而言涉及一种面向不同类型交叉口的大语言模型控制交通信号方法,包括:获取历史交通口环境集合;并进行统一的状态和动作表示形成第一矩阵;基于第一矩阵中随机采样的状态,训练近端策略优化的强化学习模型,并基于第一矩阵形成交通信号控制序列轨迹;通过卷积神经网络提取交通信号控制序列轨迹的状态数据中包含的时间序列信息,形成潜空间特征;通过线性层分别处理潜空间特征、交通信号控制序列轨迹的动作和奖励,得到输入特征;并经过训练过的微调大语言模型的运算后,形成预测特征;微调大语言模型通过损失函数和双模拟度量学习的编码器更新和优化以进行训练,预测特征包括预测状态、预测动作和预测奖励。
技术关键词
大语言模型
交叉口
预测特征
强化学习模型
卷积神经网络提取
时间序列信息
矩阵
线性
轨迹
编码器
数据
平均等待时间
交通控制系统
策略
双曲正切函数
度量
动作特征
元素
系统为您推荐了相关专利信息
拥塞控制方法
强化学习模型
数据发送速率
数据中心
交换机
冠状动脉旁路移植术
人工智能模型
特征选择方法
预测特征
队列
信息生成方法
大语言模型
信息生成装置
关键词
人工智能技术