基于DQN与混合纳什均衡的动态策略实时优化方法

正文

推荐专利

申请号：CN202510380694

申请日期：2025-03-28

公开号：CN120163068A

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种基于DQN与混合纳什均衡的动态策略实时优化方法，属于深度学习技术领域。本发明通过初始化深度神经网络估算参与者Q值，输入博弈信息构建得益矩阵；利用DQN迭代优化网络参数逼近混合纳什均衡解，提取均衡向量生成动态策略，实现实时自适应决策。该方法解决了复杂博弈场景下策略动态调整与全局优化的技术难题，适用于资源分配、智能对抗推演等领域。创新点在于结合DQN的自主学习能力与混合纳什均衡的多利益平衡机制，为高维动态博弈提供高效决策支持。

技术关键词

深度神经网络传播算法纳什均衡策略优化网络参数梯度下降算法策略标签深度学习技术矩阵模型算法蒙特卡洛动态更新预测误差资源分配数据决策时效性

系统为您推荐了相关专利信息

一种基于曲梁的扭转准零刚度隔振器快速逆向设计方法

逆向设计方法启发式算法控制点网络模型训练实数编码遗传算法

一种智能化的水下潜水泵运行异常监测方法

异常监测方法历史运行数据潜水泵设备异常数据超参数

一种融合多源异构数据的强化学习建模方法及装置

学习建模方法智能模型深度强化学习算法融合多源模态特征

非高斯环境下基于深度学习的脉冲信号重构方法

输出特征深度神经网络模型信号重构方法积层注意力机制

一种融合外部时间信息和上下文空间信息的交通流预测方法

监测站时序特征交通流预测方法序列编码器参数

基于DQN与混合纳什均衡的动态策略实时优化方法

站点导航

APP 下载