摘要
本发明公开了一种基于环境对齐大语言模型的多无人车协调控制方法,包括:提示词系统将各无人车的局部观测信息转换为结构化文本,生成策略提示和通信提示,并通过预训练的大语言模型生成可执行动作序列与通信信息。各无人车根据生成的动作执行概率,通过随机采样选择最佳行动,同时通过评论家网络计算全局状态的价值,优化策略网络参数。所有无人车共享一组策略网络参数,并利用集体轨迹数据进行集体学习与优化,从而提升系统的协同能力与决策准确性。通过这种方法,多无人车能够在动态、不确定的环境中高效协作、共同完成复杂任务。本发明能够显著提高多无人车系统的任务执行效率、协同决策能力及鲁棒性,具有广泛的应用前景。
技术关键词
协调控制方法
大语言模型
全局状态信息
生成可执行
通信网络
温度采样方法
文本
概率分布函数
序列
网络优化
格式化
指令
决策
环境状态信息
无人车系统
参数
定义策略
系统为您推荐了相关专利信息
信息融合方法
编码向量
切片
大语言模型
多模态信息融合
跑步机控制方法
调控策略
自然语言
大语言模型
智能穿戴设备
表格数据处理方法
大语言模型
执行器
策略
历史交互信息