一种面向对抗博弈的大语言模型多智能体协同决策方法

AITNT
正文
推荐专利
一种面向对抗博弈的大语言模型多智能体协同决策方法
申请号:CN202410798787
申请日期:2024-06-20
公开号:CN118734967A
公开日期:2024-10-01
类型:发明专利
摘要
本发明公开了一种面向对抗博弈的大语言模型多智能体协同决策方法,包括:构建对抗博弈环境协同决策大语言模型的微调训练数据集;基于LoRA方法微调对抗博弈环境协同决策大语言模型;构建记忆模块,存储智能体的历史博弈数据与其对博弈的理解;从对抗博弈环境中获取智能体的局部观察数据和共享全局状态信息,组合信息作为模型输入;将组合信息输入经微调的大语言模型,分析对抗博弈局势;根据上述的局势分析和记忆模块提供的信息,生成本回合的行动决策;根据行动决策生成可执行的动作;执行动作,更新记忆模块,进入下一回合。本发明方法可有效提高智能体在对抗博弈环境下进行协同决策的能力,为解决复杂系统中的协作与对抗博弈问题提供了创新的方法。
技术关键词
大语言模型 多智能体协同 决策方法 全局状态信息 记忆 文本 模块 矩阵 有效性 样本 生成可执行 参数 策略 数据存储 生成智能 消息 游戏 数据验证
系统为您推荐了相关专利信息
1
一种数据决策方法及系统
数据决策方法 生物监测设备 生物声学 深度神经网络模型 遥感影像数据
2
一种电气控制检测系统
隔离森林算法 电气控制系统 故障诊断模块 空域滤波技术 数据处理模块
3
基于改进的CNN-LSTM机械臂外力矩估计方法
力矩估计方法 池化特征 注意力 sigmoid函数 控制力矩
4
一种基于LLM和IDDQN的风机齿圈制造车间智能调度优化方法
调度优化方法 工件 齿圈 天车 风机
5
一种图像生成方法、装置、电子设备及存储介质
文本 镜头 大语言模型 图像生成方法 参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号