一种基于生成对抗网络的专家辅助智能体训练方法

AITNT
正文
推荐专利
一种基于生成对抗网络的专家辅助智能体训练方法
申请号:CN202411084772
申请日期:2024-08-08
公开号:CN118607615B
公开日期:2024-11-15
类型:发明专利
摘要
本发明涉及一种基于生成对抗网络的专家辅助智能体训练方法,收集专家经验并进行预处理,构建用于学习专家经验分布并对专家经验进行扩充的生成对抗网络模型,引入正则化技术,对所述生成对抗网络进行训练,使用训练后的生成对抗网络对预处理后的专家经验进行扩充;改进模仿学习网络,对扩充后的专家经验进行处理;对策略进行评估和优化。本发明通过生成对抗式网络对专家经验进行扩充,显著增加可用于模仿学习的数据量,提高模仿学习的效率和准确性,通过扩充专家经验降低模型在训练过程中出现过拟合的风险,减少过拟合情况的发生;生成对抗式网络生成的样本可能包含原始专家经验数据中未涵盖的新情况或策略,有效提升策略的鲁棒性和泛化性。
技术关键词
智能体训练方法 生成对抗网络模型 生成器网络 生成对抗式网络 正则化技术 门控循环单元 梯度下降优化算法 克隆方法 策略 序列 决策 噪声样本 仿真系统 传播算法 数据分类 参数 鲁棒性
系统为您推荐了相关专利信息
1
基于随机梯度下降变体的电力大模型训练优化方法
训练优化方法 随机梯度下降 电力系统 多尺度滑动窗口 随机噪声
2
基于困惑度驱动大语言模型的电网营销数据标注方法
电网营销数据 大语言模型 标注方法 答案 调用API接口
3
电力故障数据样本扩增方法、装置、设备、介质及产品
电力设备故障 条件生成对抗网络 生成对抗网络模型 数据 扩增方法
4
基于多尺度特征自适应聚焦网络的数据增强方法和装置
生成器网络 生成对抗网络 多尺度特征提取 子模块 注意力
5
一种纯水冷却系统的电导率控制方法及系统
纯水冷却系统 数据 维特比算法 稳态 生成对抗网络模型
添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案
沪ICP备2023015588号