一种基于强化学习的网络对抗决策方法

正文

推荐专利

一种基于强化学习的网络对抗决策方法

申请号：CN202510077248

申请日期：2025-01-17

公开号：CN119966697B

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了一种基于强化学习的网络对抗决策方法，属于网络对抗的技术领域，根据网络对抗过程的特点，将网络对抗过程建模为部分可观测的马尔可夫决策过程，并利用网络环境状态转移的特性，通过图的无监督和自监督任务构建网络环境表征模型；结合网络环境表征模型、基于强化学习算法构建网络对抗决策模型，针对攻击和防御两种场景形成对应智能体，包括攻击方和防守方。并在网络对抗模拟环境中进行动态博弈，通过最大化回报不断提升网络对抗的决策质量；本发明采用上述方法，将网络对抗过程转化为部分可观测的马尔可夫决策问题，结合图神经网络、基于强化学习算法实现网络对抗的策略生成，通过智能体之间的动态博弈实现网络对抗策略的优化。

技术关键词

决策方法节点特征编码器注意力机制强化学习算法参数 Softmax函数策略优化模型动态网络拓扑重构 GRU模型网络表征轨迹定义变量

系统为您推荐了相关专利信息

基于习惯分析的学习路径规划方法

学习路径规划方法习惯答题信息视频捕获设备视觉特征

基于深度学习算法的心脏病风险评估方法

风险评估方法深度学习算法标准化方法注意力机制优化器

一种基于注意力机制的跨模态哈希检索方法

矩阵哈希检索方法注意力机制文本特征值图像特征值

遥感图像目标识别模型训练方法、装置、设备及存储介质

识别模型训练方法更新模型参数解码器遥感图像数据识别头

图像生成方法、模型训练方法、装置及电子设备

图像生成模型文本生成模型背景图图样模型训练方法

一种基于强化学习的网络对抗决策方法

站点导航

APP 下载