一种基于三级玩家主从博弈的机器人决策规划方法及装置

正文

推荐专利

申请号：CN202510195188

申请日期：2025-02-21

公开号：CN120287283A

公开日期：2025-07-11

类型：发明专利

摘要

本发明实施例提供了一种基于三级玩家主从博弈的机器人决策规划方法及装置，该方法包括：根据机器人系统面对的机器人决策规划场景，构建机器人系统对应的三级玩家主从博弈决策模型；在针对三级玩家主从博弈决策模型的三级Stackelberg动态学习中，较高级玩家基于隐式微分估计较低级玩家最佳响应的全导或偏导，结合较低级玩家策略与自身策略的映射关系，求取自身代价函数的全微分，为所有玩家分别调用在给定较高级玩家策略后的代价函数的全微分，进而通过梯度下降得到新的策略，之后基于此对机器人系统进行机器人决策规划。以此方式，可以基于三级玩家主从博弈决策模型来提高机器人决策规划效果。

技术关键词

玩家机器人系统决策规划方法策略场景动态计算机电子设备处理器通信指令可读存储介质变量关系存储器模块代表

系统为您推荐了相关专利信息

多语言界面一致性的测试方法、装置、设备及存储介质

多语言界面测试方法元素文本控件

针对低密度奇偶校验LDPC码译码的自适应SPA译码方法

LDPC码译码低密度奇偶校验译码方法信噪比策略

指标推荐的方法及装置、电子设备和存储介质

指标矩阵日志因子基础

基于密度分析的聚氨酯结构胶导热性能检测方法

聚氨酯结构胶导热填料超细粉料填料体系场景

基于YOLOv8n与LGMD算法的面向汽车与行人的碰撞预警方法

碰撞预警方法动态场景信息车辆前方区域汽车算法

一种基于三级玩家主从博弈的机器人决策规划方法及装置

站点导航

APP 下载