摘要
本公开涉及人工智能领域,尤其涉及一种不完全信息博弈中基于期望值估计的在线高性能处理方法及装置。所述方法包括:获取待求解的子博弈;计算子博弈中的多个信息集各自的目标期望值,目标期望值用于指示博弈参与者在信息集下采取目标决策的预期收益;根据多个信息集各自的目标期望值,将子博弈进行剪枝和/或抽象处理;根据处理后的博弈树,采用预设博弈算法求解得到子博弈对应的目标均衡策略。本公开实施例通过在不完全信息博弈中设计了基于期望值估计的在线高性能的剪枝和/或抽象技术,能够在几秒钟内为任意子博弈场景生成目标均衡策略,满足了在线动态策略生成的需求。
技术关键词
均衡策略
博弈算法
非易失性计算机可读存储介质
决策
计算机程序指令
高性能
在线
玩家
德州扑克
节点
神经网络模型
分支
模块
游戏
处理器
场景
动态
数据
系统为您推荐了相关专利信息
强化学习网络
边缘计算方法
无人机资源分配
空天地一体化网络
卸载策略
车载传感器
修正方法
滑动窗口
LSTM算法
AI算法