摘要
本发明公开了一种基于多个大语言模型的多智能体合作围捕方法,包括:依据围捕任务定义智能体的状态空间及动作空间;初始化仿真环境,设定各智能体及围捕对象的初始位置与状态;为每个智能体选定大语言模型,同时获取或构建围捕任务数据集;选择适配围捕任务的微调策略,对选定的大语言模型进行定制化微调;编写专用的围捕提示词模板;利用微调后的围捕决策大模型控制决策,实现多智能体协同围捕;对围捕决策大模型进行评估与优化;在实际环境中部署并测试优化后的围捕决策大模型。本发明能够有效解决现实围捕任务中面临的目标不确定、环境复杂多变、时间资源限制等问题,提供了更自然的交互方式、更强的适应性和灵活性,以及更高的可解释性和透明性,同时降低人力成本,实现更高效、智能的自动化协同。
技术关键词
大语言模型
围捕方法
决策
多智能体协同
仿真环境
对象
微调方法
定义
速度
多元组
指标
资源
模板
自然语言理解
动态障碍物
数据项
分析模块
系统为您推荐了相关专利信息
脉冲神经网络模型
语义向量
多模态数据采集
决策方法
听觉
发动机控制
模式决策方法
直升机
飞行器控制技术
智能优化算法
决策方法
场景
遮挡关系
贪婪算法
机器人移动物体
深度网络模型
深度强化学习
多飞行器协同作战
决策方法
策略