交通控制及控制模型训练方法、装置、设备、介质及产品

正文

推荐专利

申请号：CN202411090601

申请日期：2024-08-08

公开号：CN119005253B

公开日期：2025-09-19

类型：发明专利

摘要

本申请公开了一种交通控制及控制模型训练方法、装置、设备、介质及产品，应用于机器学习领域。本方法通过GPT‑4得到参考结果，然后以提高输出参考结果的概率作为训练目标，得到第二大语言模型。接着，以目标评论家模型评分越高的待定结果对应的输出概率越高作为训练目标，得到目标大语言模型。本方案，将大语言模型应用在交通控制场景中，使大语言模型模仿学习GPT‑4产生的高质量决策和推理轨迹，同时引入评论家模型指导大语言模型的策略优化，使其评估并改进大语言模型的控制决策。最终得到的目标大语言模型可以产生比GPT‑4更具成本效益且更有效的控制策略。

技术关键词

大语言模型控制模型训练方法控制交通信号灯交通控制方法文本计算机程序指令模板样本决策输入模块参数计算机程序产品预训练语言模型时间段模型训练装置电子设备可读存储介质

系统为您推荐了相关专利信息

测试框架的对象层构建方法、电子设备及存储介质

层构建方法功能模块对象语义向量生成对抗网络模型

一种基于电力生产的文本数据和图片数据的融合方法及系统

图片文本融合方法预测电力设备深度学习模型

基于多模态增强检索生成技术的情感分析方法及系统

情感分析方法生成技术多模态情感分析数据检索算法

基于多模态知识驱动的绘图大模型调节方法及系统

多模态意图文本编码器参数 Softmax函数

基于人工智能问答的大数据商业智能报表系统

报表系统问答模型商业智能平台数据存储模块 MPP数据库

交通控制及控制模型训练方法、装置、设备、介质及产品

站点导航

APP 下载