一种基于最优通信资源调度策略的on-off-policy深度强化学习算法

正文

推荐专利

申请号：CN202510131469

申请日期：2025-02-06

公开号：CN120091447A

公开日期：2025-06-03

类型：发明专利

摘要

本发明提供一种基于最优通信资源调度策略的on‑off‑policy深度强化学习算法。该基于最优通信资源调度策略的on‑off‑policy深度强化学习算法，包括，S1：针对有个传感器个信道的无线网络化控制系统，算法在时刻收集状态数据，使用卡尔曼滤波对设备状态进行预测和更新，S2：基于收集到的状态数据，计算资源分配动作向量。该基于最优通信资源调度策略的on‑off‑policy深度强化学习算法，通过结合on‑policy和off‑policy深度强化学习的优势，同时利用价值函数的单调特性和经验池的动态优先级管理机制，实现了策略的快速收敛和全局最优性能，在动态复杂环境下展现出卓越的应用价值和广泛的适用性。

技术关键词

深度强化学习算法资源调度策略无线网络化控制系统更新模型参数资源分配卡尔曼滤波协方差矩阵分布式协同信道节点定义数据观测噪声样本能耗评估系统动态状态更新

系统为您推荐了相关专利信息

一种基于强化学习的多智能体思维链路构建方法及系统

链路构建方法保障智能多智能体强化学习决策强化学习策略

一种服务优化的计算机系统及其方法

资源管理单元计算机系统机器学习技术容量规划服务优化方法

新型电力系统下多元用户的电力市场行为策略确定方法

交易策略模型新型电力系统深度强化学习算法决策网络

一种快速部署移动方舱医院的分布式能源优化管理方法及系统

移动方舱医院分布式能源系统时间序列预测技术闭环管理系统时间序列预测模型

一种基于低轨卫星的多无人机协同的高效通信方法及系统

高效通信方法无人机协同虚拟仿真环境多无人机框架结构

一种基于最优通信资源调度策略的on-off-policy深度强化学习算法

站点导航

APP 下载