基于因果推断的目标条件强化学习方法及系统

AITNT
正文
推荐专利
基于因果推断的目标条件强化学习方法及系统
申请号:CN202510018280
申请日期:2025-01-07
公开号:CN119849589A
公开日期:2025-04-18
类型:发明专利
摘要
本发明公开了基于因果推断的目标条件强化学习方法及系统,涉及强化学习技术领域,基于因果推断的目标条件强化学习方法,包括以下步骤:步骤一:通过抽象函数F(s;G)对全局状态s进行处理,生成抽象状态,去除与任务无关的特征;本发明提出一种基于因果推断的去混杂策略学习方法,通过引入因果图作为代理变量切断后门路径,从而消除因果偏差。能够有效抽象状态信息,去除与任务无关的特征,并在策略学习中利用因果图实现去混杂调整,从而提高学习过程的效率和泛化能力。通过理论分析和实验验证,本发明证明了在多种环境设置下,该方法能够显著提升目标条件强化学习模型的泛化能力,为智能体在现实场景中的应用提供了更加鲁棒和可扩展的解决方案。
技术关键词
强化学习方法 抽象网络 蒙特卡洛 策略学习方法 强化学习系统 采样方法 强化学习技术 网络模块 强化学习模型 因子 特征提取网络 生成智能 后门 定义 变量 理论 偏差 场景
系统为您推荐了相关专利信息
1
一种铁路车站功能地震易损性评估方法
车站结构 铁路 地震 参数 推理算法
2
一种鲜烟叶成熟度图像评估方法及系统
鲜烟叶成熟度 图像评估方法 烟叶图像 三维结构 多任务
3
一种基于模型集群分析的代谢组学色谱峰面积校正方法
模型集群分析 SVR模型 色谱 校正方法 样本
4
一种儿童用品VOCs联合暴露风险评估方法及装置
儿童用品 暴露风险评估方法 场景 解耦方法 计算机可读指令
5
基于BP神经网络的变压器内部绝缘寿命预测方法及系统
蚂蚁 历史运行数据 节点 寿命预测方法 寿命预测系统
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号