摘要
本发明公开离线强化学习技术领域的基于相关性的离线强化学习维度缺失动作数据填补方法,具体步骤为:通过智能体与环境交互后,获取到数据集,对数据集进行分析,识别存在缺失的维度、构建并训练模型、加载包含维度缺失动作数据的数据集,读取其中的动作数据,将其转换为PyTorch张量,然后加载已预训练完毕的模型,对数据集中的缺失值进行插补,得到插补后的数据集以及将得到的数据集用于训练离线强化学习智能体,本发明有助于提高离线强化学习模型在处理不完整数据时的准确性和鲁棒性,从而增强模型在实际应用中的表现。
技术关键词
数据填补方法
离线
样本
掩码矩阵
强化学习技术
强化学习模型
加载器
定义
鲁棒性
训练集
非线性
批量
实体
代表
关系
系统为您推荐了相关专利信息
油色谱数据
数据修正装置
数据修正方法
移动平均算法
卡尔曼滤波算法
图像数据集合
图像分类方法
训练分类器
标签
优化网络参数
浓度检测方法
训练深度学习模型
海水
海洋溢油监测技术
选取特征