一种面向对抗博弈的大语言模型多智能体协同决策方法

正文

推荐专利

申请号：CN202410798787

申请日期：2024-06-20

公开号：CN118734967A

公开日期：2024-10-01

类型：发明专利

摘要

本发明公开了一种面向对抗博弈的大语言模型多智能体协同决策方法，包括：构建对抗博弈环境协同决策大语言模型的微调训练数据集；基于LoRA方法微调对抗博弈环境协同决策大语言模型；构建记忆模块，存储智能体的历史博弈数据与其对博弈的理解；从对抗博弈环境中获取智能体的局部观察数据和共享全局状态信息，组合信息作为模型输入；将组合信息输入经微调的大语言模型，分析对抗博弈局势；根据上述的局势分析和记忆模块提供的信息，生成本回合的行动决策；根据行动决策生成可执行的动作；执行动作，更新记忆模块，进入下一回合。本发明方法可有效提高智能体在对抗博弈环境下进行协同决策的能力，为解决复杂系统中的协作与对抗博弈问题提供了创新的方法。

技术关键词

大语言模型多智能体协同决策方法全局状态信息记忆文本模块矩阵有效性样本生成可执行参数策略数据存储生成智能消息游戏数据验证

系统为您推荐了相关专利信息

一种数据决策方法及系统

数据决策方法生物监测设备生物声学深度神经网络模型遥感影像数据

一种电气控制检测系统

隔离森林算法电气控制系统故障诊断模块空域滤波技术数据处理模块

基于改进的CNN-LSTM机械臂外力矩估计方法

力矩估计方法池化特征注意力 sigmoid函数控制力矩

一种基于LLM和IDDQN的风机齿圈制造车间智能调度优化方法

调度优化方法工件齿圈天车风机

一种图像生成方法、装置、电子设备及存储介质

文本镜头大语言模型图像生成方法参数

一种面向对抗博弈的大语言模型多智能体协同决策方法

站点导航

APP 下载