剑桥大学和范德夏尔实验室在 ICML 2024 上发表的立场论文,直接挑战了当前Agent开发的核心假设:我们一直在用错误的方式让Agent"自我改进"。论文作者 Tennison Liu 和 Mihaela van der Schaar 提出,真正的自我改进需要的不是更多的人工设计,而是让Agent具备"思考如何思考"的内在元认知能力intrinsic metacognitive learning。
目前大多数自我改进Agent都依赖工程师预设的固定机制,论文称之为 "外在元认知学习"。这种方式面临两个致命问题:
以 STAR(Self-Taught Reasoner)为例,虽然在特定数学问题上效果显著,但其元认知机制完全由外部控制,Agent本身对学习过程毫无感知,就像让学生按照固定教案学习,永远无法培养出独立思考能力。
元认知 来自心理学研究,指对自己思维过程的思维,简单说就是"知道自己知道什么,不知道什么"。在Agent开发中,元认知学习是双层结构:
内在元认知让Agent自己承担元认知职责,而非依赖工程师的外部设计。
论文提出的框架包含三个相互关联的组件:
元认知学习框架概览。展示了元认知系统如何监控、评估和调节底层学习过程的完整闭环机制。
当前LLM已展现出相当程度的自评估能力:能根据解题步骤对数学问题分类,识别有益的训练任务,评估自己在不同任务上的胜任程度。但LLM幻觉问题仍是重大挑战,需要通过以下工程策略来增强可靠性:
包括 进度跟踪 和 元认知反思 两个层面:
实践推荐:DeepseekR!更新以后,网上有个热议的问题“一根8米长的棍,如何进一个3×4的门”,感兴趣您可以看下这篇 《MetaMind元认知多智能体,让LLM理解对话背后的深层意图,首次达到人类水平 | 最新》
内在元认知学习的发展脉络,论文作者通过几个代表性的Agent系统来观察这一技术演进过程。研究者指出,这些系统在元认知能力的内在化程度上呈现出明显的递进关系:从完全依赖外部设计的固定机制,到逐步具备自主评估、规划和反思能力。通过分析它们在 元认知知识、元认知规划、元认知评估 三个维度上的表现,研究者展示了Agent自我改进能力的技术演进轨迹。
一个通过自我训练提升数学推理能力的系统,它能从少量示例开始,通过自我生成推理过程来解决越来越复杂的数学问题。
特点:代表完全外在的元认知控制阶段,Agent对学习过程毫无感知,所有改进策略都由人工预设,缺乏适应性和泛化能力。
一个在Minecraft游戏环境中进行终身学习的具身智能体,它能够自主探索、学习新技能并构建越来越复杂的工具和建筑。
特点:展示了更高程度的内在元认知能力
实验结果:这种内在驱动的学习方式明显优于专家设计的课程。
一个模拟人类社会行为的多智能体系统,让AI角色在虚拟小镇中像《模拟人生》一样生活、工作、社交,并形成独特的个性和记忆。
特点:在元认知反思方面提供了有价值探索,智能体能够通过抽象反思更新对身份、动机的理解,从日常活动中提取高层次洞察指导未来行为。
持续学习的经典难题,在自我改进Agent中尤为突出。
当前解决方案:
挑战:在长期开放式自我改进中的有效性仍待验证。
自主生成的学习任务往往缺乏可靠反馈。
部分解决方案:
本身就是复杂问题,论文提出三种互补评估方法:
挑战:都有各自局限性,需要开发动态自适应的评估框架。
完全内在元认知可能导致Agent陷入无效学习循环或偏离人类价值观,完全外在控制又限制适应性。论文提出 共享元认知模式:
共享元认知谱系。从完全内在的自主元认知,到人机协作的共享元认知,再到完全外在的人工控制元认知过程。
实际应用策略:可根据应用场景和Agent成熟度设计不同共享模式
自主改进带来新风险:
需要开发新的安全框架,包括:
需要让Agent的元认知决策过程变得可理解和可追踪:
这篇论文最重要的启示是重新思考Agent系统设计理念:
传统做法:详细指定Agent行为规则和学习机制
新理念:关注如何赋予Agent自主学习和适应能力
这意味着角色转变:
实际开发要求:更多投入到元认知机制设计上
考虑到内在元认知学习的复杂性,建议采用 渐进式实现策略:
传统评估:主要关注任务执行效果
新评估维度:
测试套件需求:
这篇立场论文基本描绘了后半年“全能”或“通用”Agent发展的新方向:从依赖人工设计的外在机制转向具备内在元认知能力的自主学习系统。
虽然完全实现这一愿景还面临诸多技术挑战,但论文展示的理论框架和初步证据表明,这个方向是 可行且必要的。
毕竟,只有学会"学习如何学习"的Agent,才能在快速变化的环境中持续进化,在市场中站稳脚跟。
Reference:https://arxiv.org/pdf/2506.05109
文章来自于“Al修猫Prompt”,作者“Al修猫Prompt”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。
项目地址:https://github.com/InternLM/xtuner
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0