一种智能体动作控制方法、装置、电子设备及存储介质

正文

推荐专利

申请号：CN202411744395

申请日期：2024-11-30

公开号：CN119830943A

公开日期：2025-04-15

类型：发明专利

摘要

本发明实施例提供了一种智能体动作控制方法、装置、电子设备及存储介质，在对智能体动作进行控制时，结合了辅助任务、经验双重采样和价值函数动态矫正的深度强化学习算法，通过引入辅助任务，提升了特征提取的质量，增强了模型对状态的理解能力；同时，通过经验双重采样，提高了样本的利用效率，加速了学习过程；价值函数动态矫正则有助于稳定学习过程，避免模型陷入局部最优。

技术关键词

特征提取网络解码误差动作控制方法生成训练样本估计误差动作策略生成动作决策深度强化学习算法动作控制装置矫正通信接口输出模块电子设备处理器编码存储器

系统为您推荐了相关专利信息

基于客户方言识别的智能代理人分配方法及系统

残差模块滤波模块客户注意力多尺度

基于卷积神经网络和残差注意力机制的蛋白质表达预测方法

残差注意力机制蛋白质表达神经网络训练多头注意力机制 DNA序列

一种地面终端的搜星系统及方法

信标设备通信时钟同步卡尔曼滤波算法坐标系

文本分类方法和装置、计算机设备及存储介质

决策树模型注意力特征提取网络文本分类方法词特征

一种航拍无人机的林场火灾检测算法

航拍无人机林场注意力机制通道算法

一种智能体动作控制方法、装置、电子设备及存储介质

站点导航

APP 下载