基于相关性的离线强化学习维度缺失动作数据填补方法

AITNT
正文
推荐专利
基于相关性的离线强化学习维度缺失动作数据填补方法
申请号:CN202510024529
申请日期:2025-01-08
公开号:CN119416857A
公开日期:2025-02-11
类型:发明专利
摘要
本发明公开离线强化学习技术领域的基于相关性的离线强化学习维度缺失动作数据填补方法,具体步骤为:通过智能体与环境交互后,获取到数据集,对数据集进行分析,识别存在缺失的维度、构建并训练模型、加载包含维度缺失动作数据的数据集,读取其中的动作数据,将其转换为PyTorch张量,然后加载已预训练完毕的模型,对数据集中的缺失值进行插补,得到插补后的数据集以及将得到的数据集用于训练离线强化学习智能体,本发明有助于提高离线强化学习模型在处理不完整数据时的准确性和鲁棒性,从而增强模型在实际应用中的表现。
技术关键词
数据填补方法 离线 样本 掩码矩阵 强化学习技术 强化学习模型 加载器 定义 鲁棒性 训练集 非线性 批量 实体 代表 关系
系统为您推荐了相关专利信息
1
一种复合岩浆弧环境多中心斑岩-热液成矿系统预测模型
成矿预测 矿石 样本 标记 欧氏距离算法
2
基于正负样本对比学习的原型网络DNTF共晶预测方法
共晶预测方法 预测网络模型 样本 晶体 配体
3
一种油色谱数据修正方法及装置
油色谱数据 数据修正装置 数据修正方法 移动平均算法 卡尔曼滤波算法
4
一种基于测试时间自适应的图像分类方法
图像数据集合 图像分类方法 训练分类器 标签 优化网络参数
5
一种基于近红外吸收光谱的海水含油浓度检测方法及系统
浓度检测方法 训练深度学习模型 海水 海洋溢油监测技术 选取特征
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号