一种基于最优通信资源调度策略的on-off-policy深度强化学习算法

AITNT
正文
推荐专利
一种基于最优通信资源调度策略的on-off-policy深度强化学习算法
申请号:CN202510131469
申请日期:2025-02-06
公开号:CN120091447A
公开日期:2025-06-03
类型:发明专利
摘要
本发明提供一种基于最优通信资源调度策略的on‑off‑policy深度强化学习算法。该基于最优通信资源调度策略的on‑off‑policy深度强化学习算法,包括,S1:针对有个传感器个信道的无线网络化控制系统,算法在时刻收集状态数据,使用卡尔曼滤波对设备状态进行预测和更新,S2:基于收集到的状态数据,计算资源分配动作向量。该基于最优通信资源调度策略的on‑off‑policy深度强化学习算法,通过结合on‑policy和off‑policy深度强化学习的优势,同时利用价值函数的单调特性和经验池的动态优先级管理机制,实现了策略的快速收敛和全局最优性能,在动态复杂环境下展现出卓越的应用价值和广泛的适用性。
技术关键词
深度强化学习算法 资源调度策略 无线网络化控制系统 更新模型参数 资源分配 卡尔曼滤波 协方差矩阵 分布式协同 信道 节点 定义 数据 观测噪声 样本 能耗 评估系统 动态 状态更新
系统为您推荐了相关专利信息
1
一种基于强化学习的多智能体思维链路构建方法及系统
链路构建方法 保障智能 多智能体强化学习 决策 强化学习策略
2
一种服务优化的计算机系统及其方法
资源管理单元 计算机系统 机器学习技术 容量规划 服务优化方法
3
新型电力系统下多元用户的电力市场行为策略确定方法
交易策略模型 新型电力系统 深度强化学习算法 决策 网络
4
一种快速部署移动方舱医院的分布式能源优化管理方法及系统
移动方舱医院 分布式能源系统 时间序列预测技术 闭环管理系统 时间序列预测模型
5
一种基于低轨卫星的多无人机协同的高效通信方法及系统
高效通信方法 无人机协同 虚拟仿真环境 多无人机 框架结构
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号