智能体训练方法、装置、设备、存储介质及程序产品

正文

推荐专利

申请号：CN202510787807

申请日期：2025-06-13

公开号：CN120317320B

公开日期：2025-10-14

类型：发明专利

摘要

本申请公开了一种智能体训练方法、装置、设备、存储介质及程序产品，涉及人工智能技术领域，该方法包括：根据模型超参数配置，创建智能体的训练环境；基于训练环境，初始化共享智能体，共享智能体设置核心智能体和自定义优化器的网络结构，核心智能体设置有多头自注意力网络和多演员家网络；在多进程并行环境中，根据输入图像对共享智能体进行迭代训练，获得累积折扣总奖励和总损失大小；根据累积折扣总奖励和总损失大小对共享智能体进行参数更新。由于本申请利用多头自注意力网络和多演员家网络的网络结构来优化共享智能体，可改善智能体的探索效率，避免陷入局部最优，减轻了过拟合风险，从而提高了智能体的泛化能力和采样准确性。

技术关键词

智能体训练方法模型超参数网络结构进程注意力门控循环单元共享内存状态核心网络存储结构动作策略计算机程序产品单轮参数更新模块种子人工智能技术训练设备处理器图像

系统为您推荐了相关专利信息

基于混合注意力动态反馈调节的复杂场景理解方法与系统

场景理解方法注意力机制反馈调节机制对象序列

一种探地雷达隧道衬砌病害识别方法及装置

隧道衬砌病害幅频特征深度学习网络数据探地雷达

产品全生命周期本体表征及其体系构建方法

产品全生命周期体系构建方法层次化主题建模生成对抗网络功能模块

适用于弯道场景的智能车辆跟驰行为模拟方法及模拟装置

智能车辆行驶安全系数道路摩擦系数全速度差模型模拟装置

多模态数据融合的旋转组件故障预警方法及装置

故障预警方法声发射隐马尔科夫模型旋转组件优化搜索算法

智能体训练方法、装置、设备、存储介质及程序产品

站点导航

APP 下载