摘要
本发明提供一种智能体技能自主学习方法、系统、存储介质及电子设备,其中方法包括:基于场景信息,提出多个候选目标;选取任一候选目标进行价值评估;当价值评估结果符合预期时,将价值评估结果符合预期的候选目标作为选定目标,根据选定目标进行任务规划,得到新的任务序列;基于技能库执行任务序列中的任务;当技能库不支持任务执行时,确认学习新技能,针对新技能训练技能模型,并更新技能库。基于价值驱动范式,令智能体自主产生学习新技能的动机,从而实现技能自主演化,增强智能体应对新环境时的适应能力,使智能体能够主动识别自己在技能学习方面的不足,并生成新的学习任务,极大程度上提升了智能体的自主学习能力。
技术关键词
自主学习方法
控制智能体
场景
自主学习系统
序列
状态更新
电子设备
规划
可读存储介质
物体
处理器
存储器
计算机
数据
控制模块
闭环
语义
逻辑
系统为您推荐了相关专利信息
分布式光伏
承载能力评估方法
分布特征
接入节点
光伏接入容量评估方法
技能评估
提升系统
强化学习模型
计划
模拟演练系统
灯光控制装置
中央控制板
灯光控制系统
交互终端
道具模型
输电线路作业
安全监管方法
作业对象
监控视频流
图像像素