BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本
AI技术研报 2026-06-15 09:20
+8037 阅读

BudgetMem:给 Runtime Agent Memory 装上 “预算路由器”

让记忆系统学会按需分配运行成本


当 LLM Agent 处理长期对话、多轮交互和复杂文档时,Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文,并支撑跨时间的推理能力。


但一个现实问题常常被忽视:Agent Memory 到底应该花多少成本来处理历史?


如果一个 query 只需要简单事实,是否有必要调用昂贵的 LLM 进行复杂总结?如果一个 query 依赖跨时间、跨实体、跨主题的多条证据,低成本检索和粗粒度摘要又是否足够?


对此,研究团队提出 BudgetMem: Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory,旨在让 Agent Memory 从固定的记忆处理流水线,转向 query-aware 的动态预算分配机制:对于简单 query 使用低成本处理路径,对于复杂 query 则自动调用更高质量的记忆模块。


BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本


  • 论文:《Learning Query-Aware Budget-Tier Routing for Runtime Agent Memory
  • 链接:https://arxiv.org/abs/2602.06025


背景:固定记忆流水线难以适应不同 Query


现有很多 Agent Memory System 仍然遵循一种固定范式:先离线构建记忆,再在未来统一检索使用。


这种 build once, use always 的方式虽然直观,但存在两个问题。首先,它是 query-agnostic 的。系统在不知道未来问题的情况下提前压缩历史,可能会丢掉后续 query 真正需要的细节。其次,它缺乏显式的 performance-cost control。简单问题和复杂问题往往被同一套流程处理,前者可能浪费成本,后者又可能预算不足。


因此,本文关注一个更贴近真实部署的问题:当 query 到来时,记忆系统应该花多少计算去处理历史?


Runtime Query-Aware Memory Extraction


BudgetMem 将记忆构建从固定离线流程转向 runtime query-aware extraction。系统首先将历史保留为原始 chunks,当用户 query 到来时,再检索相关片段,并通过模块化流水线构建 query-focused memory。


在本文实验中,团队采用了一个简单且可解释的模块化实例:


Filtering → Entity / Temporal / Topic Extraction → Summarization


其中,Filtering 负责筛选相关 chunks;Entity、Temporal、Topic 模块分别提取实体、时间和主题相关信息;Summary 模块最终整合为面向当前 query 的记忆。


需要强调的是,这一模块组合只是 BudgetMem 在实验中的具体实例,并不是框架本身的限制。BudgetMem 的核心在于为模块化 memory pipeline 提供统一的 budget-tier interface,因此也可以适配到其他 memory modules 或不同形式的记忆处理流水线中。


关键在于,每个 memory module 都提供 LOW / MID / HIGH 三种 budget tiers。也就是说,同一个模块既可以用低成本方式执行,也可以用更高质量但更昂贵的方式执行。这样,记忆系统不再固定调用同一套流程,而是根据当前 query 的复杂度和信息需求,动态选择合适的记忆处理路径。


BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本


三种 Budget-Tier 策略


为了系统研究 runtime memory 中的性能成本权衡,BudgetMem 比较了三种 budget-tier realization strategies。


Implementation Tiering:改变模块实现方式,从规则 / 启发式方法,到轻量模型,再到 LLM-based 模块。


Reasoning Tiering:改变推理行为,从 direct extraction,到 CoT-style reasoning,再到 multi-step 或 reflection-style processing。


Capacity Tiering:改变模型大小,用不同规模的模型实现同一个 memory module。


这三种策略分别对应算法复杂度、推理深度和模型规模三个预算轴,使 BudgetMem 不只是一个省 token trick,而是一个系统研究 runtime memory performance-cost trade-off 的统一框架。


用强化学习训练 Budget Router


BudgetMem 设计了一个轻量级 Budget Router,在 runtime memory extraction 的每一步为当前模块选择合适的预算档位。Router 会根据 query、当前模块输入和模块描述,动态决定该模块使用 LOW / MID / HIGH 哪一档,从而在低成本处理和高质量提取之间做出取舍。


由于整个 memory extraction 过程包含离散的检索、规则、小模型和 LLM 调用,难以直接端到端求导,本文将 budget-tier selection 建模为一个 sequential decision problem,并使用强化学习训练 Router。


每个 query 的处理过程对应一个 episode。最终回答质量作为 task reward,记忆提取成本作为 cost reward。通过调节 cost weight,BudgetMem 可以在 performance-first 和 cost-sensitive 设置之间灵活切换:预算宽松时优先提升记忆质量和回答性能,预算紧张时则主动选择低成本路径,降低整体调用开销。


实验结果

在效果与成本之间取得更优权衡


本文在 LoCoMo、LongMemEval 和 HotpotQA 上评估 BudgetMem,并与 ReadAgent、MemoryBank、A-MEM、Mem0、MemoryOS、LightMem 等强基线比较。实验显示,在 performance-first 设置下,BudgetMem 在 F1 和 LLM-Judge 上整体优于现有 memory baselines。


BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本


同时,当我们调节 cost weight 时,BudgetMem 能形成连续、可控的 performance-cost frontier:在相近成本下取得更好效果,在相近效果下降低记忆提取成本。


进一步分析表明,不同 tiering strategy 适用于不同场景。Implementation 和 Capacity Tiering 覆盖更宽的预算范围,更适合从低成本到高性能的部署需求;Reasoning Tiering 更像细粒度质量调节旋钮,适合在相近成本区间内进一步提升记忆质量。


BudgetMem:给Runtime Agent Memory装上「预算路由器」,让记忆系统学会按需分配运行成本


总结:让 Agent Memory 学会 “按需计算”


BudgetMem 的核心观点是:未来的 Agent Memory 不应只是固定地存储、检索和压缩历史,而应根据当前 query 的需求,动态决定投入多少计算来提取和组织记忆。


对于简单 query,系统可以走低成本路径快速处理;对于复杂 query,则可以主动调用更强模块、更深推理或更大模型,获得更可靠的记忆支持。


因此,BudgetMem 希望推动 Agent Memory 从 “固定流程” 走向 “按需计算”:让记忆系统不只是会记住历史,还能判断什么时候该 “快速扫一眼”,什么时候该 “认真回看”、整理证据并投入更多计算。这种能力也将成为长期对话、个性化智能体和真实部署场景中的关键基础。


文章来自于"机器之心",作者 "机器之心"。

1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案