一种基于生成对抗网络的专家辅助智能体训练方法

正文

推荐专利

申请号：CN202411084772

申请日期：2024-08-08

公开号：CN118607615B

公开日期：2024-11-15

类型：发明专利

摘要

本发明涉及一种基于生成对抗网络的专家辅助智能体训练方法，收集专家经验并进行预处理，构建用于学习专家经验分布并对专家经验进行扩充的生成对抗网络模型，引入正则化技术，对所述生成对抗网络进行训练，使用训练后的生成对抗网络对预处理后的专家经验进行扩充；改进模仿学习网络，对扩充后的专家经验进行处理；对策略进行评估和优化。本发明通过生成对抗式网络对专家经验进行扩充，显著增加可用于模仿学习的数据量，提高模仿学习的效率和准确性，通过扩充专家经验降低模型在训练过程中出现过拟合的风险，减少过拟合情况的发生；生成对抗式网络生成的样本可能包含原始专家经验数据中未涵盖的新情况或策略，有效提升策略的鲁棒性和泛化性。

技术关键词

智能体训练方法生成对抗网络模型生成器网络生成对抗式网络正则化技术门控循环单元梯度下降优化算法克隆方法策略序列决策噪声样本仿真系统传播算法数据分类参数鲁棒性

系统为您推荐了相关专利信息

基于随机梯度下降变体的电力大模型训练优化方法

训练优化方法随机梯度下降电力系统多尺度滑动窗口随机噪声

基于困惑度驱动大语言模型的电网营销数据标注方法

电网营销数据大语言模型标注方法答案调用API接口

电力故障数据样本扩增方法、装置、设备、介质及产品

电力设备故障条件生成对抗网络生成对抗网络模型数据扩增方法

基于多尺度特征自适应聚焦网络的数据增强方法和装置

生成器网络生成对抗网络多尺度特征提取子模块注意力

一种纯水冷却系统的电导率控制方法及系统

纯水冷却系统数据维特比算法稳态生成对抗网络模型

一种基于生成对抗网络的专家辅助智能体训练方法

站点导航

APP 下载