基于连续强化学习的数据处理方法及系统

正文

推荐专利

基于连续强化学习的数据处理方法及系统

申请号：CN202510026660

申请日期：2025-01-08

公开号：CN119962704A

公开日期：2025-05-09

类型：发明专利

摘要

本发明公开了基于连续强化学习的数据处理方法及系统，属于机器学习和人工智能领域，其具体包括：从情景记忆模块和回放缓存模块中采样转换数据，计算先前和当前任务的策略网络梯度，并据此计算梯度夹角；根据梯度夹角调整当前任务梯度方向，并生成对抗性样本；使用对抗性样本更新策略网络和批评网络参数，同时动态调整学习率；迭代训练过程中，不断更新记忆模块和缓存模块，并定期评估模型性能；该方法能有效提升强化学习模型的训练效率和泛化能力，避免模型遗忘旧知识。

技术关键词

对抗性数据处理方法策略网络数据处理系统强化学习模型样本模型更新参数强化学习框架反余弦函数记忆回放模块时序动态符号格式算法

系统为您推荐了相关专利信息

一种焊接缺陷检测方法、装置及存储介质

焊接缺陷检测方法焊接缺陷检测装置图像检测单元神经网络模型位点

一种基于挥发物的植物健康监测预警及处理系统和方法

植物健康预警模块预警模型分析模块主成分分析降维

蒸馏酒智能分类方法及装置

智能分类方法蒸馏神经网络模型智能分类装置照片

废塑料产生量多元时序预测方法及系统

环卫系统垃圾回收设施时序预测方法垃圾中转站网格

一种针对对抗攻击的乳腺超声图像鲁棒分割方法及其系统

乳腺超声图像原型矢量量化方法卷积神经网络参数卷积神经网络学习

基于连续强化学习的数据处理方法及系统

站点导航

APP 下载