基于DQN与混合纳什均衡的动态策略实时优化方法

AITNT
正文
推荐专利
基于DQN与混合纳什均衡的动态策略实时优化方法
申请号:CN202510380694
申请日期:2025-03-28
公开号:CN120163068A
公开日期:2025-06-17
类型:发明专利
摘要
本发明公开了一种基于DQN与混合纳什均衡的动态策略实时优化方法,属于深度学习技术领域。本发明通过初始化深度神经网络估算参与者Q值,输入博弈信息构建得益矩阵;利用DQN迭代优化网络参数逼近混合纳什均衡解,提取均衡向量生成动态策略,实现实时自适应决策。该方法解决了复杂博弈场景下策略动态调整与全局优化的技术难题,适用于资源分配、智能对抗推演等领域。创新点在于结合DQN的自主学习能力与混合纳什均衡的多利益平衡机制,为高维动态博弈提供高效决策支持。
技术关键词
深度神经网络 传播算法 纳什均衡策略 优化网络参数 梯度下降算法 策略标签 深度学习技术 矩阵 模型算法 蒙特卡洛 动态更新 预测误差 资源分配 数据 决策 时效性
系统为您推荐了相关专利信息
1
一种基于曲梁的扭转准零刚度隔振器快速逆向设计方法
逆向设计方法 启发式算法 控制点 网络模型训练 实数编码遗传算法
2
一种智能化的水下潜水泵运行异常监测方法
异常监测方法 历史运行数据 潜水泵设备 异常数据 超参数
3
一种融合多源异构数据的强化学习建模方法及装置
学习建模方法 智能模型 深度强化学习算法 融合多源 模态特征
4
非高斯环境下基于深度学习的脉冲信号重构方法
输出特征 深度神经网络模型 信号重构方法 积层 注意力机制
5
一种融合外部时间信息和上下文空间信息的交通流预测方法
监测站 时序特征 交通流预测方法 序列 编码器参数
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号