摘要
本发明提供一种太空领域博弈行为动态演化与策略推演优化方法及系统,涉及太空领域博弈行为优化技术领域,包括利用深度神经网络分析历史行为数据,构建参与方动态关系图,并输入多智能体强化学习模型,输出博弈行为模型。然后,构建多层博弈场景演化树,结合双重神经网络计算即时收益和长期风险,并利用分层注意力机制的搜索算法进行动态更新,生成候选演化路径。最后,利用时空图神经网络构建的策略评估模型对候选路径进行评估,选取最优策略路径,并结合知识推理引擎生成分阶段实施的策略部署方案。本发明能够有效预测太空领域博弈行为演化趋势,并提供可行的策略部署方案,提升策略决策的科学性和有效性。
技术关键词
多智能体强化学习
策略
分层注意力
多维特征向量
时序
神经网络结构
深度神经网络
强化学习模型
搜索算法
注意力机制
编码器结构
节点特征
动态更新
拜占庭容错共识算法
分布式学习
分阶段
系统为您推荐了相关专利信息
协同管理系统
网络互通
分发模块
子系统
故障检测模块
编辑方法
指令
虚拟现实引擎
三维模型
VR编辑器
电能表检定流水线
任务调度方法
特征选择算法
状态信息数据
风险
数字孪生建模方法
三维空间模型
三维地形模型
对象
三维模型
高效整流器
热管理方法
雪崩现象
电耦合
热耦合模型