深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI专利库 AI需求对接 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载
深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口
AI资讯 2026-06-17 14:06
+8828 阅读

深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口


01 Agent下半场,盯上的不是软件预算,而是工资表


AI 真正的终局之战,可能根本不在 C 端。过去两年,我们见证了无数个打着“个人助理”旗号的 AI 应用争夺流量入口,像极了移动互联网早期的百团大战。


一个明显信号是,OpenAI 和 Anthropic 这样的模型公司,正在把注意力从个人助手转向企业级 Agent。OpenAI 把 enterprise AI 作为下一阶段战略,强调让 agents 进入公司级工作流;Anthropic 也在金融、法律、销售、财务等企业场景里推出面向知识工作的 agents。下半场的胜负手,不再看谁拥有更多好玩的入口,而在to B。


更值得关注的是,两家公司都在强化 FDE(Forward Deployed Engineer)这样的组织形态。FDE 不是普通售前,也不是传统客户成功,而是让工程师直接进入客户现场,把模型能力嵌入真实业务系统。OpenAI 的 FDE 团队定位,是把研究突破变成企业生产系统;Anthropic 的 FDE 则强调直接嵌入战略客户,交付能解决真实业务问题的 AI 应用。


这说明一个重要变化:Agent 的价值不只发生在 API 调用里,而发生在企业内部最复杂、最具体、最难标准化的工作流里。


背后的逻辑并不复杂,AI ToB 和上一代 SaaS,本质上不是同一门生意。SaaS 做的是辅助人。CRM 、ERP、数据看板都是为了提高效率,但最终仍然依赖人来操作、判断和执行。所以 SaaS 的天花板,本质上是企业软件预算。全球 SaaS 市场可以做到数千亿美元规模,已经非常大,但仍然只是企业 IT 支出的一部分。


这一轮 AI ToB 不一样。当 AI 不只是帮人写邮件、做 PPT、查资料,而是开始承担客服、销售、运营、财务、研发、投研、法务、管理分析等岗位中的可标准化工作时,它面对的就不再是几千亿美元的软件订阅,而是全球十万亿美元级的工资表


这也是为什么资本市场重新理解 AI 应用层价值时,开始不再只看“有多少用户”,而是看它能不能进入真实工作流,能不能替代人力,能不能形成可持续的业务闭环。


深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口

(SpaceX招股书中预测,AI的企业级应用市场是22.7万亿美金)


因此,Agent 下半场真正的战场会转向 2B。问题是,企业 Agent 的落地方式,并不会只有一条。美国更自然的路线,是集中式数据中心、超级大模型、云端化 SaaS;但在中国,这条路线未必是唯一答案。中国企业对数据安全、私有化部署、成本控制和供应链自主的要求更强。大量中小企业也不可能用美国式高价云端 token,把所有内部工作流持续外包给超级模型。


中国市场可能需要一种具有本土特色的企业 AI 生态。Zleap(智跃)给出的答案是:小型一体机,本地算力,本地数据,本地 Agent,端云协同。


02 中国企业AI,可能需要一条不同于美国的路线


Agent 大机会在2B,但它在中国应该怎样落地?


美国企业 AI 分工是:超级模型在云端,企业工作流向云端集中。这条路线有明显优势。模型最强,迭代最快,生态最完整。对于大型跨国企业和云原生公司来说,把 agents 接入 Salesforce、Slack、Microsoft 365、GitHub、Snowflake 等系统,是一条顺滑的路径。


但中国企业面对的是另一组约束。第一,数据不能轻易离开企业。代码库、客户资料、合同、会议、财务、供应链、销售线索、组织沟通,这些都是企业最核心的生产资料。对很多行业来说,数据出内网不是效率问题,而是合规和生存问题。


第二,成本不能按 token 无限增长。Agent 一旦进入企业,就不是偶尔问答,而是 24 小时在线,持续读取数据、分析异常、生成内容、跟进任务。如果每一个动作都依赖云端大模型,成本会随着组织规模、数据规模和 Agent 数量一起膨胀。


第三,中国企业需要可控的供应链。模型、算力、数据、部署、权限、审计,都不能完全依赖单一海外云端生态。尤其当 Agent 开始进入生产系统,它就不再是一个工具,而是企业数字基础设施的一部分。


这也是为什么 Zleap 提出了小型一体机的产品形态。


深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口

(Zleap一体机介绍)


它不是传统意义上的“卖硬件”,而是试图定义中国企业 AI 的一个新入口:一台 10 万元以内、单卡、本地部署的企业 Agent 一体机。如果按月摊销,成本不到 1 万元。它要替代的,不是一套软件订阅,而是多个岗位里大量重复、标准、可自动化的信息处理工作。


对企业而言,这是一笔可以算清楚的账。客服、运营、助理、资料整理、项目跟进等任意一个岗位,月综合成本可能已经接近甚至超过这个数字。而一体机的价值,不只是替代某一个人,而是让企业内部出现一组可以 24 小时在线、持续处理上下文、按权限协同工作的数字员工。


更关键的是,算力和数据都在本地。企业不用把会议、代码、客户、财务、项目进度持续送到云端,也不用被某个云端模型的价格、限额、策略和服务稳定性完全绑定。日常任务、隐私数据,可以尽量由本地小模型处理;本地模型处理不了的复杂推理、多模态任务、长链路任务,再调用云端强模型。


这是一条更符合中国企业约束的工程路线。美国路线押注超级模型和集中式云。中国路线可能需要押注本地化、低成本、可控、安全和端云协同。Zleap 的一体机,正是这条路线上的早期样本。


03 只把模型搬到本地还不够,真正难的是让小模型能干活


一体机的外在形态很清楚:本地算力、本地数据、本地部署。难点在于,它不能只是把开源模型搬到企业内网,再套一个聊天界面。本地小模型天然有边界:参数更小,推理能力更弱,长上下文能力更有限,复杂工具调用也更容易出错。企业不可能接受一个“看起来安全但不好用”的本地 AI。


所以 Zleap 过去一段时间做的,不是简单包装模型,而是在一体机约束下做基础研究:如何让有限算力里的小模型,获得足够好的数据、足够干净的上下文和足够可靠的运行框架。然后他们就推出了 SAG 和 Zleap-Agent。


SAG 解决数据问题。企业内部最有价值的数据,往往不是整理好的知识库,而是散落在会议、代码、客户沟通、财务系统、项目工具里的原始记录。传统 RAG 会把文档切成片段,做向量搜索,再把相似内容塞给模型。这适合简单问答,却不适合长期工作的 Agent。


Agent 需要理解的是关系:谁和谁有关,哪条信息更新了旧状态,哪个项目风险来自哪次会议,哪个客户反馈影响了哪个产品决策。SAG 的核心做法,是把原始数据组织成“事项 + 实体”的结构。事项保留完整语义,实体负责索引关联。它不依赖沉重的全局知识图谱,也不把语义拆碎成脆弱的三元组,而是用更简单、更轻量的超图结构,让 Agent 能在多跳关系里找到关键证据。


深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口

(摘选自SAG的论文)


从他们发布的论文看,在相同 Embedding 和 LLM 配置下,SAG 在 HotpotQA、2WikiMultiHop、MuSiQue 等多跳问答数据集上,相比旧 SOTA HippoRAG 2 取得了显著领先,拿到了新的 SOTA。平均 Recall@2,SAG 为 79.30%,HippoRAG 2 为 68.14%;在更复杂的 MuSiQue 上,SAG 的 Recall@5 达到 80.04%,HippoRAG 2 为 65.13%。


关键不只是“分数更高”。HippoRAG 2 代表的是上一阶段结构化 RAG 的强方案:它证明了 RAG 不能只靠向量,必须引入结构化记忆和多跳检索。但 SAG 的结果说明,下一步未必是把图谱做得更重,而是用更轻、更适合增量写入的结构,把企业数据组织成 Agent 真正能使用的上下文。


这对一体机非常关键。因为本地小模型不能靠无限上下文硬读所有材料。它需要在进入模型之前,就被系统喂给更少、更准、更有关系的数据。


在数据底座之上,Zleap-Agent 解决的是运行时问题:自研的Agent Harness。


深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口

(Zleap-Agent开源版本的截图)


今天很多 Agent 框架默认背后有一个足够强的大模型,把工具、记忆、历史、规则全部塞进上下文窗口,让模型自己筛选。对本地小模型来说,把所有东西都塞进去,往往不是增强,而是噪声。


Zleap-Agent 在 Agent Harness 层提出了 Workspace 的概念,本质上是一种 Agent 层面的稀疏注意力机制。进入销售 Workspace,Agent 只看到客户、合同、跟进记录和销售工具;进入财务 Workspace,Agent 只看到预算、发票、审批规则和财务记忆;进入研发 Workspace,Agent 只看到代码、任务、缺陷和发布历史。同一个 Agent,不需要每一步都看到所有工具、所有历史、所有记忆。


这和模型层的稀疏注意力很像:不要让系统在每一步处理全部信息,而是让它只处理当前场景真正相关的上下文。


这个设计带来的价值,是让本地小模型能做更大的事:减少上下文浪费,降低工具误用,避免记忆串扰,也让不同 Workspace 可以自然绑定不同模型。普通任务用本地模型,复杂任务进云端强模型,视觉任务进多模态对应的Workspace。


更重要的是,Zleap-Agent 不是把记忆当成一个外挂向量库,而是基于SAG把记忆做成原生运行时能力。


在企业场景里,记忆不只有一类。人的偏好、项目状态、客户进展、部门经验、历史决策和权限边界,都必须被分区管理。Zleap-Agent 的 Workspace 天然带有自己的工作记忆:销售 Workspace 沉淀客户和跟进上下文,财务 workspace 沉淀预算和审批上下文,研发 Workspace 沉淀代码、任务和发布上下文。


这让 Agent 不只是“查一次资料、答一次问题”,而是能在长期工作中积累组织经验,同时避免不同用户、不同部门、不同场景之间的记忆污染。


SAG 和 Zleap-Agent 并不是两个孤立技术点。它们共同回答了一个一体机的核心问题:如何在极其有限的本地资源下,让 Agent 真正可用。


04 如果每个企业都有一群本地Agent,新的企业互联网会如何形成?


从产品形态看,Zleap 一体机交付的是一台设备。但从产业位置看,它想切入的是企业内部的 Agent 操作系统。


深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口

(Zleap企业版系统简述)


这个操作系统大致分成三层。第一层,是本地数据和本地 Agent。一台一体机进入企业后,首先接入会议、代码、客户系统、财务系统、项目管理、内部文档和更多业务数据。SAG 把这些原始信息结构化,让 Agent 获得可靠上下文;Zleap-Agent 把工具、记忆、权限和模型按 workspace 分区,让本地小模型在正确场景里工作。到这一步,企业已经不只是拥有一个聊天机器人,而是拥有了一组能在内部系统里持续工作的本地 Agent。


第二层,是 Agent 信息流。主动 Agent 在后台持续观察、分析和生成判断。但企业真正需要的不是一堆分散的 Agent 日志,而是一个统一的协作界面。


这就是信息流的意义。它不是普通内容社区,也不是把报告换一种排版方式,而是人管理一群 Agent 的统一界面。项目风险、客户变化、经营机会、异常提醒、阶段性结果,不再散落在一个个对话框里,而是被整理成可浏览、可评论、可追问、可继续协作的信息单元,推送给该知道的人。过去企业依赖人来同步信息,Agent 信息流把这件事变成了自动化。


第三层,是 Agent 局域网。当企业内部有了本地数据底座、原生记忆、Workspace 分区和信息流界面,多个 Agent 就不再是孤立工具,而会逐渐形成一个内部协作网络。销售 Agent、财务 Agent、研发 Agent、运营 Agent、老板 Agent、项目 Agent、客户 Agent,都在不同权限和 Workspace 下工作。它们既能服务人,也能彼此协作;既能处理本地数据,也能在必要时调用云端能力。当这些局域网进一步互联,未来才可能出现真正的 Agent 互联网,这也是中国企业 AI 最值得想象的地方。企业也不再只是部署AI,而是在部署一组可以被调用、协作和交易的数字劳动力。


这也是 Zleap 这条路线最宏大的想象力。它不是在做一个更好看的 AI 聊天框,也不是在做一个普通的企业知识库,而是在尝试把 AI 从云端工具,变成企业内部可部署、可治理、可协作、可扩展的本地智能基础设施。


Zleap个人版产品已经可以体验,企业版一体机已经开放预购。按照他们目前的计划,第一批设备将在 2026 年 7 月交付。


深度|Agent时代的下半场:谁在抢占中国企业AI的基础设施入口

(Zleap个人版截图)


这仍然是一个非常早期的市场。但大方向已经足够清晰。Agent 下半场,真正的战场会转向企业劳动力市场。如果 AI ToB 的本质不再是卖软件,而是重构企业用人的方式,那么这轮浪潮的市场规模、商业模型和基础设施形态,都将远远超出上一代 SaaS。


在中国,谁能率先把本地算力、企业数据、Agent Harness、权限治理和端云协同组合成一套可交付的系统,谁就可能拿到企业 AI 时代的第一张门票。Zleap 正在押注的,正是这张门票。


文章更多相关信息:

Zleap产品链接:https://zleap.com

SAG开源链接:https://github.com/Zleap-AI/SAG

SAG论文链接: https://arxiv.org/abs/2606.15971 

Zleap-Agent开源链接:https://github.com/Zleap-AI/Zleap-Agent


文章来自于"Z Potentials",作者 "Z Potentials"。

1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

3
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

4
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

添加客服微信openai178,进AITNT官方交流群
驱动智慧未来:提供一站式AI转型解决方案