一种用于智能控制的强化学习状态表示优化方法

正文

推荐专利

申请号：CN202510468842

申请日期：2025-04-15

公开号：CN120370688A

公开日期：2025-07-25

类型：发明专利

摘要

本发明提出了一种用于智能控制的强化学习状态表示优化方法，属于强化学习技术领域，首先从当前状态与后续状态之间的特征相关性和时间连续性角度进行状态特征的提取，然后引入对比协同模块，利用对比学习增强状态表示的鲁棒性，通过生成查询状态和键状态，并采用指数移动平均(EMA)机制优化查询编码器和键编码器的参数，最后通过将自过滤模块与对比协同模块结合，成功解决了高维状态表示、时间依赖性建模和状态鲁棒性提升等强化学习任务中的核心问题；本发明尤其适用于具有复杂环境动态的强化学习任务，如机器人控制、自动驾驶等。

技术关键词

强化学习模型过滤模块模型训练模块策略强化学习技术编码器参数位置编码器轨迹机器人控制动态鲁棒性网络决策指数框架计算机

一种用于智能控制的强化学习状态表示优化方法

站点导航

APP 下载