一种针对智能体目标导向强化学习的对抗鲁棒性提升方法

正文

推荐专利

申请号：CN202510155048

申请日期：2025-02-12

公开号：CN120197648A

公开日期：2025-06-24

类型：发明专利

摘要

本发明公开了一种针对智能体目标导向强化学习的对抗鲁棒性提升方法，其步骤包括：1)从目标条件强化学习智能体与环境交互中采集一组训练数据；其中，组中的每一训练数据表示为<s,g,r,a,s′>，s表示状态，g表示目标，r表示奖励，a表示采取的动作，s′表示下一状态；构造多个负样本用于增加表征扰动的多样性；2)最大化采集的训练数据中原始输入元组<s,g>与对应的负样本之间的表征距离，得到扰动后的对抗样本；3)使用扰动后的对抗样本增强目标条件强化学习智能体的价值函数和策略函数，优化编码器网络、行为者网络和评价者网络；4)基于优化后的编码器网络、行为者网络和评价者网络构建鲁棒性提升的目标导向强化学习智能体。

技术关键词

样本网络编码器鲁棒性策略存储计算机程序智能机器人智能系统数据对抗性处理器元素可读存储介质存储器定义服务器因子代表

系统为您推荐了相关专利信息

一种方言语音识别方法和系统

语音识别模型音频字幕方言语音识别方法语音识别模块

基于论文关键词及语义共现与中心度指标的学科领域划分方法

关键词论文划分方法核心节点

图像分类模型训练方法、图像分类方法、装置及设备

分类图像数据图像分类方法卷积模块神经网络处理器样本

基于神经网络模型的网络安全空间数据资产动态更新方法

神经网络模型动态更新方法资产网络节点数值

一种基于DDS系统网络安全动态风险评估方法

动态风险评估方法 DDS系统服务器节点网络风险评估技术传感器节点

一种针对智能体目标导向强化学习的对抗鲁棒性提升方法

站点导航

APP 下载