智能体的引导方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411478308

申请日期：2024-10-22

公开号：CN119443198A

公开日期：2025-02-14

类型：发明专利

摘要

本申请涉及一种智能体的引导方法、装置、电子设备及存储介质，其中，方法包括：对目标数据集中的每个原始状态加入高斯噪声，以得到扰动后的状态；利用至少一个约束条件约束初始训练策略，以得到实际训练策略，其中，实际训练策略在扰动后的状态上引发的转移分布与原始状态下基于价值的状态转移分布对齐；从扰动后的状态开始，引导智能体基于实际训练策略转移到基于价值的状态转移分布中的高价值分布内状态。由此，解决了相关技术中，计算效率较低，且算法的简洁性较差，在数据集包含大量次优状态的情况下，易影响策略质量的技术问题。

技术关键词

策略表达式数据电子设备噪声处理器引导装置网络可读存储介质存储器模块程序计算机算法参数

系统为您推荐了相关专利信息

一种基于多尺度特征融合的锂电池内部温度预测与重建方法

锂电池内部温度多尺度特征融合锂电池模组累积分布函数状态空间模型

人体图像分割方法和装置、电子设备及存储介质

编码特征视频帧人体图像分割方法图像编码序列

一种高效率核主泵转子故障诊断方法及装置

核主泵转子故障诊断方法皮尔逊相关系数故障分类模型高效率

一种桥梁结构变形的多模型并行预测方法

并行预测方法环境监测数据桥梁结构预测模型建立方法日期

根管峡部3D打印研究模型的构建方法、设备、介质及产品

数据阈值分割法磨牙根管三维模型处理器

智能体的引导方法、装置、电子设备及存储介质

站点导航

APP 下载