智能体训练方法及装置、电子设备、存储介质

正文

推荐专利

申请号：CN202411939576

申请日期：2024-12-26

公开号：CN119701377B

公开日期：2025-12-05

类型：发明专利

摘要

本公开提供了一种智能体训练方法及装置、电子设备、存储介质，属于智能体训练技术领域，该方法包括：确定主智能体的第一策略模型和陪练智能体的第二策略模型，第一策略模型为主智能体历史版本池中的模型，第二策略模型为陪练智能体历史版本池中的模型；基于第一策略模型和第二策略模型的交互数据对第一策略模型进行更新得到第三策略模型，基于第一策略模型和第二策略模型的交互数据对第二策略模型进行更新得到第四策略模型；将第三策略模型加入主智能体历史版本池中，将第四策略模型加入到陪练智能体历史版本池中。本公开提供的智能体训练方法及装置、电子设备、存储介质能够满足在非对称任务中策略多变、环境复杂的实际需求。

技术关键词

智能体训练方法策略深度强化学习算法电子设备数据更新可读存储介质处理器模型更新训练装置存储器计算机参数模块数值

系统为您推荐了相关专利信息

飞行汽车编队控制方法、系统、电子设备及存储介质

飞行汽车避障路径环境状态信息编队控制方法动态避障

基于粒计算的新发心肌梗死分级分类预测方法及装置

心肌梗死患者 xgboost模型预测装置多层堆栈机器学习框架

自适应窗口直达声提取方法、装置、电子设备及存储介质

音频窗口系数计算机可执行指令傅里叶变换处理矩阵

一种智能化的全屋热水循环管理系统

循环管理系统热水终端需求预测模型标签管理

基于光网络的路由与波长分配方法及相关设备

波长分配方法比例模型时间段可再生能源源节点

智能体训练方法及装置、电子设备、存储介质

站点导航

APP 下载