面向强化学习算法的数据处理方法、系统、设备和介质

正文

推荐专利

申请号：CN202510082754

申请日期：2025-01-20

公开号：CN119903894A

公开日期：2025-04-29

类型：发明专利

摘要

本申请涉及一种面向强化学习算法的数据处理方法、系统、设备和介质，包括：通过将目标参数与目标强化算法进行配置化处理，能方便快捷地调整目标参数以达到优化训练的效果。通过将时序差分作为智能体和数据环境交互的基础过程，以此来解决对统一训练范式的建模，配合接口函数、经验回放池和多种辅助操作，能够快速方便的接入强化学习算法和强化学习数据环境的同时，高效地对算法进行修改、调试和优化，减少算法实现上带来的逻辑负担。

技术关键词

强化学习算法数据处理方法策略更新钩子参数动作交互时序数据处理系统因子逻辑接口轨迹处理器基础样本计算机设备调度器

系统为您推荐了相关专利信息

基于数字孪生模型的排产方案生成方法、系统及装置

数字孪生模型订单数字孪生技术生成方法工作量

一种采用真空钎焊工艺的钎料箔带的切割定位方法

真空钎焊工艺电阻点焊工艺夹层结构芯体轮廓识别

一种基于量子语义纠缠的矿石规模关键参数估算方法

参数估算方法估算系统矿石语义规模

一种绿色建筑多目标优化设计方法、装置、电子设备和可读存储介质

太阳辐射吸收系数绿色建筑优化设计方法舒适度理想点法

绳网系统发射参数优化方法、装置、电子设备和存储介质

发射参数优化方法绳网系统多项式灵敏度分析方法发射系统

面向强化学习算法的数据处理方法、系统、设备和介质

站点导航

APP 下载