一种基于离线强化学习的策略制定方法及相关设备

正文

推荐专利

申请号：CN202511039910

申请日期：2025-07-28

公开号：CN120781912A

公开日期：2025-10-14

类型：发明专利

摘要

本发明提供一种基于离线强化学习的策略制定方法及相关设备，获取数据集；其中，数据集包括：在不同时间段下通过同一单策略采集得到的数据、在同一时间段下通过不同单策略采集得到的数据、在不同时间段下通过同一策略组合采集得到的数据、在同一时间段下通过不同策略组合采集得到的数据；根据数据集生成多个元组，根据各个元组构建相应的价值函数，并利用价值函数和各个元组构建相应的策略模型；通过智能体利用待测小区执行当前策略得到的当前状态、当前动作和当前奖励预测待测小区的下一状态，并根据当前状态、当前动作、当前奖励和待测小区的下一状态，预测下一动作；利用下一动作更新当前策略，得到待测小区的业务保障策略。

技术关键词

策略制定方法时间段小区无线网络系统计算机可执行指令模型训练方法数据离线可读存储介质存储器参数处理器程序电子设备关系算法

系统为您推荐了相关专利信息

一种基于NPL的语义识别模型及其训练方法

词语语句词性信息标记基准

基于多源数据的地表形变高差演变测量系统

三维地形模型反射点时延信号传播路径信号识别模块

无线资源分配方法、装置、基站设备可读存储介质

通信业务信息分配信息样本无线资源分配方法小区

一种基于BMS的电池安全管理方法及系统

K均值聚类算法电池运行状态决策树分类方法滑动窗口技术管理方法

一种考虑源网荷互动的城市电网分区协调恢复方法及系统

城市电网分区源网荷恢复方法节点城市配电网

一种基于离线强化学习的策略制定方法及相关设备

站点导航

APP 下载