摘要
本发明公开了一种面向对抗博弈的大语言模型多智能体协同决策方法,包括:构建对抗博弈环境协同决策大语言模型的微调训练数据集;基于LoRA方法微调对抗博弈环境协同决策大语言模型;构建记忆模块,存储智能体的历史博弈数据与其对博弈的理解;从对抗博弈环境中获取智能体的局部观察数据和共享全局状态信息,组合信息作为模型输入;将组合信息输入经微调的大语言模型,分析对抗博弈局势;根据上述的局势分析和记忆模块提供的信息,生成本回合的行动决策;根据行动决策生成可执行的动作;执行动作,更新记忆模块,进入下一回合。本发明方法可有效提高智能体在对抗博弈环境下进行协同决策的能力,为解决复杂系统中的协作与对抗博弈问题提供了创新的方法。
技术关键词
大语言模型
多智能体协同
决策方法
全局状态信息
记忆
文本
模块
矩阵
有效性
样本
生成可执行
参数
策略
数据存储
生成智能
消息
游戏
数据验证
系统为您推荐了相关专利信息
数据决策方法
生物监测设备
生物声学
深度神经网络模型
遥感影像数据
隔离森林算法
电气控制系统
故障诊断模块
空域滤波技术
数据处理模块
力矩估计方法
池化特征
注意力
sigmoid函数
控制力矩