摘要
本发明提供了一种结合大模型与自博弈技术的自主决策方法、装置、设备及存储介质。首先获取结构化传感器数据和非结构化情报数据,并采用MoE架构大语言模型处理多模态信息,将结果与初始提示词结合生成结构化决策输入;随后依次由第一层指挥官智能体基于结构化输入生成多个候选决策策略,并分配给第二层执行智能体模拟执行;第三层评估智能体对执行结果进行多维度协同性评估,不满足预设阈值时将反馈信息返回指挥官智能体调整策略;最终,对满足评分条件的候选策略集进行模拟博弈,将执行结果及评分数据重新输入MoE大语言模型,融合生成最终决策方案,并以评分阈值为终止条件输出。解决了现有的自主决策无法面对复杂动态的战场环境需求的问题。
技术关键词
自主决策方法
策略
数据
可用智能
分布式一致性算法
KM算法
飞行动力学模型
航迹规划算法
分解算法
控制智能体
资源分配
多模态信息
矩阵
分层
协商算法
指令
同步协议