基于视觉表征的单智能体强化学习模型的训练方法、装置、电子设备、存储介质和计算机程序产品

正文

推荐专利

申请号：CN202411601987

申请日期：2024-11-11

公开号：CN119580029B

公开日期：2025-07-22

类型：发明专利

摘要

本公开涉及一种基于视觉表征的单智能体强化学习模型的训练方法、装置、电子设备、存储介质和计算机程序产品，单智能体强化学习模型单智能体强化学习模型包括在线状态编码器、动作编码器、强化学习网络和辅助任务网络，辅助任务网络包括状态预测模型，根据目标智能体当前时间段基于针对目标智能体的观测图像而得到的状态信息和动作信息，以及当前时间段的奖赏信息，通过辅助任务网络从视觉表征的角度出发，学习目标智能体的状态表征和动作表征，通过强化学习网络为目标智能体选择最佳决策动作，并且，充分利用强化学习中时间段的时序信息，可以实现单智能体在具有挑战的以图像作为状态输入的复杂连续控制任务中的性能和样本效率提升。

技术关键词

强化学习模型预测特征状态编码器动作特征强化学习网络时间段动作预测模型视觉在线计算机程序产品训练装置处理器计算机可执行指令电子设备多层感知机图像

系统为您推荐了相关专利信息

一种基于AI的钢琴练习辅助方法、系统、设备及介质

动作特征情感分析模型情感特征信号处理技术深度学习算法

建筑施工现场无人机智能巡检的路径规划方法

路径规划方法建筑施工现场智能巡检无人机深度强化学习模型

一种基于交叉注意力机制的视觉-力反馈手术机器人状态编码方法、介质及系统

交叉注意力机制手术机器人编码方法视觉特征信号编码器

一种基于强化学习的道口调度方法及系统

决策道口强化学习模型复杂度人机协同

一种基于强化学习的水母目标检测方法

卷积特征滑动滤波器局部特征提取卷积滤波器动态

基于视觉表征的单智能体强化学习模型的训练方法、装置、电子设备、存储介质和计算机程序产品

站点导航

APP 下载