一种基于多智能体深度强化学习的两阶段激励方法

正文

推荐专利

申请号：CN202510901283

申请日期：2025-06-30

公开号：CN120806036A

公开日期：2025-10-17

类型：发明专利

摘要

本发明公开了一种基于多智能体深度强化学习的两阶段激励方法，涉及智能体深度强化学习技术领域，为了解决现有技术中激励方法的过程过于繁琐以及效果不佳的问题。本发明通过特定区域的仿真实验，以出租车为参与者模拟真实感知任务地理分布与轨迹规划，采用深度Q学习、历史参与率优化等对比机制，结合平均参与者效用、平台效用、任务完成率等多维指标，验证方案在动态环境中的适应性，结合不同传感器特性量化成本，使参与者能精准评估自身能耗，在预算约束下最大化平台效用，同时通过预算与任务覆盖的双向制衡，确保任务“最小可行性覆盖”与预算不超支，训练时可观测其他智能体动作以优化协作，执行时仅依赖本地状态，适应多参与者竞争场景。

技术关键词

多智能体深度强化学习激励方法平台阶段任务分配算法能耗层次分析法深度Q学习复杂度深度强化学习技术动态网络任务分配策略资源数据出租车机制图表

系统为您推荐了相关专利信息

地图数据更新方法、装置、设备、存储介质及程序产品

交通设施地图数据更新方法地图要素计算机执行指令地图数据更新装置

一种芯片至晶圆的键合设备

龙门平台运动台定位检测机构伺服运动控制倒装机构

一种折叠式爬坡机构

爬坡机构承重平台支撑立柱作业机器人轻质合金型材

一种平台车牌识别方法与系统

车辆车牌识别方法图像处理模块跨模态融合特征模态特征

一种自聚焦型晶圆三维形貌精密检测装置及方法

显微扫描平台反射式光谱仪精密检测装置精密检测方法超辐射发光二极管

一种基于多智能体深度强化学习的两阶段激励方法

站点导航

APP 下载