基于相关性的离线强化学习维度缺失动作数据填补方法

正文

推荐专利

申请号：CN202510024529

申请日期：2025-01-08

公开号：CN119416857A

公开日期：2025-02-11

类型：发明专利

摘要

本发明公开离线强化学习技术领域的基于相关性的离线强化学习维度缺失动作数据填补方法，具体步骤为：通过智能体与环境交互后，获取到数据集，对数据集进行分析，识别存在缺失的维度、构建并训练模型、加载包含维度缺失动作数据的数据集，读取其中的动作数据，将其转换为PyTorch张量，然后加载已预训练完毕的模型，对数据集中的缺失值进行插补，得到插补后的数据集以及将得到的数据集用于训练离线强化学习智能体，本发明有助于提高离线强化学习模型在处理不完整数据时的准确性和鲁棒性，从而增强模型在实际应用中的表现。

技术关键词

数据填补方法离线样本掩码矩阵强化学习技术强化学习模型加载器定义鲁棒性训练集非线性批量实体代表关系

系统为您推荐了相关专利信息

一种复合岩浆弧环境多中心斑岩-热液成矿系统预测模型

成矿预测矿石样本标记欧氏距离算法

基于正负样本对比学习的原型网络DNTF共晶预测方法

共晶预测方法预测网络模型样本晶体配体

一种油色谱数据修正方法及装置

油色谱数据数据修正装置数据修正方法移动平均算法卡尔曼滤波算法

一种基于测试时间自适应的图像分类方法

图像数据集合图像分类方法训练分类器标签优化网络参数

一种基于近红外吸收光谱的海水含油浓度检测方法及系统

浓度检测方法训练深度学习模型海水海洋溢油监测技术选取特征

基于相关性的离线强化学习维度缺失动作数据填补方法

站点导航

APP 下载