摘要
本发明公开了一种基于MCTS与自博弈的对抗效能评估方法、系统、设备及介质,通过结合蒙特卡洛树搜索和深度神经网络(智能体),创新性地引入了自博弈机制,自博弈过程中,利用模拟真实对抗环境生成高质量的训练数据,不断优化智能体的策略网络和价值网络;本发明在大状态空间内有效搜索和评估,能够实时适应对手策略的快速变化和复杂反馈,通过多轮自博弈模拟,不仅提高了效能评估的精度和实时性,还为复杂对抗环境中的策略优化提供了可靠的技术支持。
技术关键词
雷达模拟器
效能评估方法
蒙特卡洛树搜索
节点
孩子
数据收集单元
上限置信区间算法
效能评估系统
决策
策略
深度神经网络
脉冲
处理器
符号
参数
可读存储介质
样本
系统为您推荐了相关专利信息
降尘控制
降尘作业
动态预警方法
喷雾装置
控制中心
天然气管道
动态贝叶斯网络
疲劳裂纹扩展
设备组件
故障树模型
策略网络模型
独立智能
任务调度方法
多边缘
节点
功率
优化系统参数
分层强化学习
光纤系统
光纤传能系统