深度｜Agent时代的下半场：谁在抢占中国企业AI的基础设施入口

AI资讯 2026-06-17 14:06

+9666 阅读

01 Agent下半场，盯上的不是软件预算，而是工资表

AI 真正的终局之战，可能根本不在 C 端。过去两年，我们见证了无数个打着“个人助理”旗号的 AI 应用争夺流量入口，像极了移动互联网早期的百团大战。

一个明显信号是，OpenAI 和 Anthropic 这样的模型公司，正在把注意力从个人助手转向企业级 Agent。OpenAI 把 enterprise AI 作为下一阶段战略，强调让 agents 进入公司级工作流；Anthropic 也在金融、法律、销售、财务等企业场景里推出面向知识工作的 agents。下半场的胜负手，不再看谁拥有更多好玩的入口，而在to B。

更值得关注的是，两家公司都在强化 FDE(Forward Deployed Engineer)这样的组织形态。FDE 不是普通售前，也不是传统客户成功，而是让工程师直接进入客户现场，把模型能力嵌入真实业务系统。OpenAI 的 FDE 团队定位，是把研究突破变成企业生产系统；Anthropic 的 FDE 则强调直接嵌入战略客户，交付能解决真实业务问题的 AI 应用。

这说明一个重要变化：Agent 的价值不只发生在 API 调用里，而发生在企业内部最复杂、最具体、最难标准化的工作流里。

背后的逻辑并不复杂，AI ToB 和上一代 SaaS，本质上不是同一门生意。SaaS 做的是辅助人。CRM 、ERP、数据看板都是为了提高效率，但最终仍然依赖人来操作、判断和执行。所以 SaaS 的天花板，本质上是企业软件预算。全球 SaaS 市场可以做到数千亿美元规模，已经非常大，但仍然只是企业 IT 支出的一部分。

这一轮 AI ToB 不一样。当 AI 不只是帮人写邮件、做 PPT、查资料，而是开始承担客服、销售、运营、财务、研发、投研、法务、管理分析等岗位中的可标准化工作时，它面对的就不再是几千亿美元的软件订阅，而是全球十万亿美元级的工资表。

这也是为什么资本市场重新理解 AI 应用层价值时，开始不再只看“有多少用户”，而是看它能不能进入真实工作流，能不能替代人力，能不能形成可持续的业务闭环。

深度｜Agent时代的下半场：谁在抢占中国企业AI的基础设施入口

（SpaceX招股书中预测，AI的企业级应用市场是22.7万亿美金）

因此，Agent 下半场真正的战场会转向 2B。问题是，企业 Agent 的落地方式，并不会只有一条。美国更自然的路线，是集中式数据中心、超级大模型、云端化 SaaS；但在中国，这条路线未必是唯一答案。中国企业对数据安全、私有化部署、成本控制和供应链自主的要求更强。大量中小企业也不可能用美国式高价云端 token，把所有内部工作流持续外包给超级模型。

中国市场可能需要一种具有本土特色的企业 AI 生态。Zleap（智跃）给出的答案是：小型一体机，本地算力，本地数据，本地 Agent，端云协同。

02 中国企业AI，可能需要一条不同于美国的路线

Agent 大机会在2B，但它在中国应该怎样落地？

美国企业 AI 分工是：超级模型在云端，企业工作流向云端集中。这条路线有明显优势。模型最强，迭代最快，生态最完整。对于大型跨国企业和云原生公司来说，把 agents 接入 Salesforce、Slack、Microsoft 365、GitHub、Snowflake 等系统，是一条顺滑的路径。

但中国企业面对的是另一组约束。第一，数据不能轻易离开企业。代码库、客户资料、合同、会议、财务、供应链、销售线索、组织沟通，这些都是企业最核心的生产资料。对很多行业来说，数据出内网不是效率问题，而是合规和生存问题。

第二，成本不能按 token 无限增长。Agent 一旦进入企业，就不是偶尔问答，而是 24 小时在线，持续读取数据、分析异常、生成内容、跟进任务。如果每一个动作都依赖云端大模型，成本会随着组织规模、数据规模和 Agent 数量一起膨胀。

第三，中国企业需要可控的供应链。模型、算力、数据、部署、权限、审计，都不能完全依赖单一海外云端生态。尤其当 Agent 开始进入生产系统，它就不再是一个工具，而是企业数字基础设施的一部分。

这也是为什么 Zleap 提出了小型一体机的产品形态。

深度｜Agent时代的下半场：谁在抢占中国企业AI的基础设施入口

（Zleap一体机介绍）

它不是传统意义上的“卖硬件”，而是试图定义中国企业 AI 的一个新入口：一台 10 万元以内、单卡、本地部署的企业 Agent 一体机。如果按月摊销，成本不到 1 万元。它要替代的，不是一套软件订阅，而是多个岗位里大量重复、标准、可自动化的信息处理工作。

对企业而言，这是一笔可以算清楚的账。客服、运营、助理、资料整理、项目跟进等任意一个岗位，月综合成本可能已经接近甚至超过这个数字。而一体机的价值，不只是替代某一个人，而是让企业内部出现一组可以 24 小时在线、持续处理上下文、按权限协同工作的数字员工。

更关键的是，算力和数据都在本地。企业不用把会议、代码、客户、财务、项目进度持续送到云端，也不用被某个云端模型的价格、限额、策略和服务稳定性完全绑定。日常任务、隐私数据，可以尽量由本地小模型处理；本地模型处理不了的复杂推理、多模态任务、长链路任务，再调用云端强模型。

这是一条更符合中国企业约束的工程路线。美国路线押注超级模型和集中式云。中国路线可能需要押注本地化、低成本、可控、安全和端云协同。Zleap 的一体机，正是这条路线上的早期样本。

03 只把模型搬到本地还不够，真正难的是让小模型能干活

一体机的外在形态很清楚：本地算力、本地数据、本地部署。难点在于，它不能只是把开源模型搬到企业内网，再套一个聊天界面。本地小模型天然有边界：参数更小，推理能力更弱，长上下文能力更有限，复杂工具调用也更容易出错。企业不可能接受一个“看起来安全但不好用”的本地 AI。

所以 Zleap 过去一段时间做的，不是简单包装模型，而是在一体机约束下做基础研究：如何让有限算力里的小模型，获得足够好的数据、足够干净的上下文和足够可靠的运行框架。然后他们就推出了 SAG 和 Zleap-Agent。

SAG 解决数据问题。企业内部最有价值的数据，往往不是整理好的知识库，而是散落在会议、代码、客户沟通、财务系统、项目工具里的原始记录。传统 RAG 会把文档切成片段，做向量搜索，再把相似内容塞给模型。这适合简单问答，却不适合长期工作的 Agent。

Agent 需要理解的是关系：谁和谁有关，哪条信息更新了旧状态，哪个项目风险来自哪次会议，哪个客户反馈影响了哪个产品决策。SAG 的核心做法，是把原始数据组织成“事项 + 实体”的结构。事项保留完整语义，实体负责索引关联。它不依赖沉重的全局知识图谱，也不把语义拆碎成脆弱的三元组，而是用更简单、更轻量的超图结构，让 Agent 能在多跳关系里找到关键证据。

深度｜Agent时代的下半场：谁在抢占中国企业AI的基础设施入口

（摘选自SAG的论文）

从他们发布的论文看，在相同 Embedding 和 LLM 配置下，SAG 在 HotpotQA、2WikiMultiHop、MuSiQue 等多跳问答数据集上，相比旧 SOTA HippoRAG 2 取得了显著领先，拿到了新的 SOTA。平均 Recall@2，SAG 为 79.30%，HippoRAG 2 为 68.14%；在更复杂的 MuSiQue 上，SAG 的 Recall@5 达到 80.04%，HippoRAG 2 为 65.13%。

关键不只是“分数更高”。HippoRAG 2 代表的是上一阶段结构化 RAG 的强方案：它证明了 RAG 不能只靠向量，必须引入结构化记忆和多跳检索。但 SAG 的结果说明，下一步未必是把图谱做得更重，而是用更轻、更适合增量写入的结构，把企业数据组织成 Agent 真正能使用的上下文。

这对一体机非常关键。因为本地小模型不能靠无限上下文硬读所有材料。它需要在进入模型之前，就被系统喂给更少、更准、更有关系的数据。

在数据底座之上，Zleap-Agent 解决的是运行时问题：自研的Agent Harness。

深度｜Agent时代的下半场：谁在抢占中国企业AI的基础设施入口

（Zleap-Agent开源版本的截图）

今天很多 Agent 框架默认背后有一个足够强的大模型，把工具、记忆、历史、规则全部塞进上下文窗口，让模型自己筛选。对本地小模型来说，把所有东西都塞进去，往往不是增强，而是噪声。

Zleap-Agent 在 Agent Harness 层提出了 Workspace 的概念，本质上是一种 Agent 层面的稀疏注意力机制。进入销售 Workspace，Agent 只看到客户、合同、跟进记录和销售工具；进入财务 Workspace，Agent 只看到预算、发票、审批规则和财务记忆；进入研发 Workspace，Agent 只看到代码、任务、缺陷和发布历史。同一个 Agent，不需要每一步都看到所有工具、所有历史、所有记忆。

这和模型层的稀疏注意力很像：不要让系统在每一步处理全部信息，而是让它只处理当前场景真正相关的上下文。

这个设计带来的价值，是让本地小模型能做更大的事：减少上下文浪费，降低工具误用，避免记忆串扰，也让不同 Workspace 可以自然绑定不同模型。普通任务用本地模型，复杂任务进云端强模型，视觉任务进多模态对应的Workspace。

更重要的是，Zleap-Agent 不是把记忆当成一个外挂向量库，而是基于SAG把记忆做成原生运行时能力。

在企业场景里，记忆不只有一类。人的偏好、项目状态、客户进展、部门经验、历史决策和权限边界，都必须被分区管理。Zleap-Agent 的 Workspace 天然带有自己的工作记忆：销售 Workspace 沉淀客户和跟进上下文，财务 workspace 沉淀预算和审批上下文，研发 Workspace 沉淀代码、任务和发布上下文。

这让 Agent 不只是“查一次资料、答一次问题”，而是能在长期工作中积累组织经验，同时避免不同用户、不同部门、不同场景之间的记忆污染。

SAG 和 Zleap-Agent 并不是两个孤立技术点。它们共同回答了一个一体机的核心问题：如何在极其有限的本地资源下，让 Agent 真正可用。

04 如果每个企业都有一群本地Agent，新的企业互联网会如何形成？

从产品形态看，Zleap 一体机交付的是一台设备。但从产业位置看，它想切入的是企业内部的 Agent 操作系统。

深度｜Agent时代的下半场：谁在抢占中国企业AI的基础设施入口

（Zleap企业版系统简述）

这个操作系统大致分成三层。第一层，是本地数据和本地 Agent。一台一体机进入企业后，首先接入会议、代码、客户系统、财务系统、项目管理、内部文档和更多业务数据。SAG 把这些原始信息结构化，让 Agent 获得可靠上下文；Zleap-Agent 把工具、记忆、权限和模型按 workspace 分区，让本地小模型在正确场景里工作。到这一步，企业已经不只是拥有一个聊天机器人，而是拥有了一组能在内部系统里持续工作的本地 Agent。

第二层，是 Agent 信息流。主动 Agent 在后台持续观察、分析和生成判断。但企业真正需要的不是一堆分散的 Agent 日志，而是一个统一的协作界面。

这就是信息流的意义。它不是普通内容社区，也不是把报告换一种排版方式，而是人管理一群 Agent 的统一界面。项目风险、客户变化、经营机会、异常提醒、阶段性结果，不再散落在一个个对话框里，而是被整理成可浏览、可评论、可追问、可继续协作的信息单元，推送给该知道的人。过去企业依赖人来同步信息，Agent 信息流把这件事变成了自动化。

第三层，是 Agent 局域网。当企业内部有了本地数据底座、原生记忆、Workspace 分区和信息流界面，多个 Agent 就不再是孤立工具，而会逐渐形成一个内部协作网络。销售 Agent、财务 Agent、研发 Agent、运营 Agent、老板 Agent、项目 Agent、客户 Agent，都在不同权限和 Workspace 下工作。它们既能服务人，也能彼此协作；既能处理本地数据，也能在必要时调用云端能力。当这些局域网进一步互联，未来才可能出现真正的 Agent 互联网，这也是中国企业 AI 最值得想象的地方。企业也不再只是部署AI，而是在部署一组可以被调用、协作和交易的数字劳动力。

这也是 Zleap 这条路线最宏大的想象力。它不是在做一个更好看的 AI 聊天框，也不是在做一个普通的企业知识库，而是在尝试把 AI 从云端工具，变成企业内部可部署、可治理、可协作、可扩展的本地智能基础设施。

Zleap个人版产品已经可以体验，企业版一体机已经开放预购。按照他们目前的计划，第一批设备将在 2026 年 7 月交付。

深度｜Agent时代的下半场：谁在抢占中国企业AI的基础设施入口

（Zleap个人版截图）

这仍然是一个非常早期的市场。但大方向已经足够清晰。Agent 下半场，真正的战场会转向企业劳动力市场。如果 AI ToB 的本质不再是卖软件，而是重构企业用人的方式，那么这轮浪潮的市场规模、商业模型和基础设施形态，都将远远超出上一代 SaaS。

在中国，谁能率先把本地算力、企业数据、Agent Harness、权限治理和端云协同组合成一套可交付的系统，谁就可能拿到企业 AI 时代的第一张门票。Zleap 正在押注的，正是这张门票。

文章更多相关信息：

Zleap产品链接：https://zleap.com

SAG开源链接：https://github.com/Zleap-AI/SAG

SAG论文链接: https://arxiv.org/abs/2606.15971

Zleap-Agent开源链接：https://github.com/Zleap-AI/Zleap-Agent

文章来自于"Z Potentials"，作者 "Z Potentials"。

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！

项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址：https://github.com/n8n-io/n8n

在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。

项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file

【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。

项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。

项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。

项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目

项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。

项目地址：https://github.com/TaskingAI/TaskingAI