一种基于高斯过程预测的非零和多玩家博弈的Q-学习方法

AITNT
正文
推荐专利
一种基于高斯过程预测的非零和多玩家博弈的Q-学习方法
申请号:CN202410737136
申请日期:2024-06-07
公开号:CN118732502A
公开日期:2024-10-01
类型:发明专利
摘要
本发明公开了一种基于高斯过程预测的非零和多玩家博弈的Q‑学习方法,属于机器学习和自动控制技术领域,具体涉及一种结合高斯过程预测和脱策略交错Q‑学习方法,具体步骤如下:步骤一,建立一个包含随机扰动的多玩家非零和博弈问题模型;步骤二,求解非零和博弈纳什均衡解的强化学习方法;步骤三,高斯过程预测模型建模方法;步骤四,脱策略交错Q‑学习方法。本发明的优点效果是提供一种能够在存在随机干扰的环境中稳定且有效地求解多玩家非零和博弈问题的强化学习算法,提高系统的整体性能和稳定性,本方法能够适应环境的动态变化,有效处理因随机干扰引起的不确定性,为多玩家博弈问题的解决提供了一种新的技术途径。
技术关键词
玩家 模型建模方法 强化学习方法 控制策略 矩阵 超参数 强化学习算法 自动控制技术 定义 访问系统 数据 噪声 方程 规划 动态
系统为您推荐了相关专利信息
1
毫米波成像方法、装置及设备
深度学习模型 参数 回波 数据 毫米波成像
2
热泵型间接蒸发冷却数据中心空调温度控制系统及方法
冷却数据中心 空调温度控制方法 空调温度控制系统 热泵型 Attention机制
3
一种适用于工业机器人的运行效率综合评价系统
综合评价系统 工业机器人 关节 轨迹 数据处理组件
4
基于深度学习的门诊调度方法及系统
深度神经网络 门诊调度系统 矩阵 速度 规划
5
基于计算机视觉的针片状含量检测方法及系统
影像传感器 计算机视觉 粗集料 片状 三维模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号