大厂围猎AI智能体

搜索
AI-TNT
正文
资源拓展
大厂围猎AI智能体
2025-05-07 10:21

开始抢食


大模型的征战还未结束,一场关于AI Agent(智能体)的围猎之战又轰然开启。


被称为“全球首款真正意义通用AI Agent”的Manus,据报道近日完成一轮7500万美元的融资,融资后估值达5亿美元,比之前增长了约五倍。这距离其3月初上线只过去了个把月。


而这可能仅仅是大战序幕。近日,字节跳动悄然上线内测“扣子空间”;百度在开发者大会推出“心响”App;阿里云则以Qwen3开源模型引爆技术圈;OpenAI豪赌编程Agent;MCP 协议成为行业“通用插座”……大厂们在Agent赛道上正展开一场决定未来十年话语权的生态暗战。


AI Agent是什么,与人们日常使用的大模型有何不同?为什么这么火?大厂们在这场角逐中又各自抢得了怎样的竞争身位?


01「不敢错失的战场」


3月6日,Manus一夜之间名声大噪,它生动诠释了AI Agent的概念:通过大模型的感知推理能力,它能自主拆解任务链,调用知识库、联网搜索、软件工具等资源,执行复杂任务,完成闭环操作。


以筛选简历为例,Manus不仅能解压文件、浏览简历,还能给出排名建议和评估标准,最终以电子表格形式呈现结果,俨然一名负责招聘的实习生。


大厂围猎AI智能体

*图源互联网


当前,人们主要通过Chatbot(聊天机器人)与大模型交互,Chatbot属于能说会道,但不干实事儿。Agent则可以自主调用工具,能实际执行一些人们生活和工作中的常见任务,也就是能真正干活儿了。


这种从对话响应到任务执行的跨越,开启了远超Chatbot的商业想象空间。


Anthropic CEO Dario Amodei曾断言,未来2~3年内,AI可能在几乎所有任务上超越人类,五年内智能体将渗透90%的企业工作流。而据Markets & Markets测算,2024年全球AI Agent市场规模约为51亿美金,2030年有望增长至471亿美元,年复合增长率达44.8%。


面对AI Agent的巨大潜力,国内外AI厂商纷纷加快布局。


4月17日,OpenAI推出了具备更强Agent能力的推理模型o3和o4-mini,并预测至2029年,AI Agent及其他新产品的销售额将超越ChatGPT,推高总营收至1250亿美元,2030年总营收有望达到1740亿美元。


字节跳动则在Manus出圈后,调动多个团队开发不同的Agent产品,并于近日内测上线了“扣子空间”,提供多项技能的AI通用实习生。


大厂围猎AI智能体

*图源百度


“Agent是我们最看好的AI应用发展方向。”百度李彦宏曾如此表示。4月25日,在Create2025百度AI开发者大会上,百度发布文心大模型4.5 Turbo和深度思考模型X1 Turbo两款新模型之外,还发布了多款AI应用产品,其中就包括官方定位为通用超级智能体的心响App。


4月29日,阿里云开源了Qwen3系列模型,并在评估模型Agent能力的BFCL评测中,创下70.8分的新高,超越Gemini2.5-Pro、OpenAI-o1等顶尖模型,这将大幅降低Agent调用工具的门槛,为即将到来的智能体和大模型应用爆发提供更好的支持。


02「个人版“贾维斯”VS数字化员工」


各大厂商对Agent的探索方向已现分野——有的走通用路线,有的走专业垂直路线;有的选择To C突围,扮演钢铁侠的“贾维斯”,争夺个人助理入口;有的则选择To B 深耕,嵌入企业工作流,打造数字化员工。


百度和OpenAI目前走的是To C路线。OpenAI的ChatGPT是常年霸榜的头部应用,月活跃用户已达5亿。拥有这个超级入口,OpenAI自然希望通过ChatGPT构建可适应任意场景的认知引擎。


另外,OpenAI还着重押注编程Agent。此前发布的“Operator”能让智能体接管用户电脑操作,例如自动编写代码并调试运行。前些天,OpenAI又发布了一个叫Codex CLI的开源轻量化编程Agent,可以使用OpenAI的模型,接管本地计算机终端命令行界面,直接进行代码编写。OpenAI还表示,未来将发布一系列编程工具,重新定义AI时代的编程。


百度则是专门研发了一款Agent应用——心响App,定位用户的智能生活助理,目前已在安卓上线,苹果iOS系统正在审核中,也将于近期上线。为了降低使用门槛,也为了激发用户对新应用的使用灵感,心响App特意预置了十大应用场景,包括例行任务、城市旅游、AI相亲、AI绘本、摸鱼游戏、深度研究、法律咨询、健康咨询、智慧图表和试题讲解等。


以AI绘本为例,用户只需要输入一个简单的主题,比如“狐狸的电话亭”,心响App就可主动连线百度文库AI小助手,按照用户对角色设定、配音、风格的偏好,完成绘本大纲,直至最终生成绘本视频。操作非常简便。据透露,心响App目前支持超过200种任务类型,未来计划扩展到10万+的应用场景。


大厂围猎AI智能体

*图源心响


与上述两家不同,微软与字节更希望通过B端办公需求切入。微软将Copilot植入Office、Teams等产品矩阵,试图把智能体变成企业工作流的“隐形中枢”。据统计,截至今年4月,超10万家企业使用Copilot Studio,日均处理任务超1亿次。微软预测,2025年Agent业务收入将占其AI总营收的35%。


大厂围猎AI智能体

*图源扣子空间


“和Agent一起开始你的工作”“扣子空间是你和AI Agent协同办公的最佳场所”,这是字节对扣子空间的产品定位,与微软一样试图将通用Agent概念嵌入工作流,帮助用户处理文件检索、表格制作、报告生成等任务。字节旗下协同办公应用——飞书的多维表格、飞书文档等服务也可接入,更强化了扣子空间作为数字员工的工作能力。


阿里则一边不断加强C端产品夸克的能力,一边在B端的钉钉上重点搭建AI Agent应用平台。目前钉钉AI助理已经聚合了AI客服、HR、AI销小帮、行政搭子、代码优化大师等众多工具,构建全链路企业服务矩阵。


目前来看,面向C端的Agent,除非像ChatGPT一样拥有庞大的用户基础,不然挑战很大。最大的问题是,普通用户对Agent还没多少概念,缺乏明确的使用目的,很多只是为了尝鲜玩玩。如果使用体验不够极致,无法给用户带来惊喜,其用户黏性就很难保持。Manus一直没有移动端,百度心响App无疑有身先士卒的勇气。但作为全新的一款应用,心响App完全没有用户积累,需要从0做起,势必需要百度投入巨大的资源。


而面向B端,因企业降本刚需明确、场景垂直,且由于一般企业都可能建立自己的知识库,办公类Agent执行任务更有针对性,交付效果无疑也会更好。另外,在商业化方面,微软Copilot、钉钉和飞书也都已经具备现成的营收手段,比C端的会员收费也更自然得多,预计发展会相对顺畅。


03「生态与标准暗战」


除了智能体,当下AI领域最炙手可热的概念,莫过于MCP。而MCP与智能体之间又存在着紧密的联系。


“MCP让AI更懂外部世界,更容易获得信息,更自由地调用工具,是AI发展的一大步。”李彦宏在Create 2025百度AI开发者大会上多次强调MCP的重要性,“现在基于MCP开发智能体,就像2010年开发移动APP。”


大模型性能再好也不是万能的,Agent要处理复杂的、多环节的任务,就需要与外部的工具或服务进行交互。但在MCP出现之前,交互缺乏统一标准。做个形象的比喻,就好比秘书联系不同部门,都需要切换不同的通讯方式,比如电话、邮件、微信、钉钉、飞书等,自然毫无效率可言。


大厂围猎AI智能体

*图源互联网


去年11月,Anthropic提出并开源了MCP,即模型上下文协议,旨在提供统一标准,可以理解为AI世界的USB-C,使Agent可像搭积木般调用航班查询、地图导航等服务。比如,在旅游规划测试中,接入MCP的Agent能依次调用航班、酒店、地图接口,任务完成效率比传统API对接提升5倍。


在Anthropic的推动下,尤其是在OpenAI和Google等巨头相继明确表态支持后,MCP正从一个有潜力的提议,加速成为被广泛接受的标准。据MCP社区PulseMCP统计,全球已经有超过4000个MCP服务器上线,而这一数字还在迅速增长。


国内AI厂商近期积极支持MCP。4月25日,百度宣布公司各产品全面拥抱MCP,既包括百度搜索、百度文库、百度网盘等应用,也包括文心基础大模型和百度智能云千帆平台;字节扣子空间也集成了飞书云文档、多维表格和高德地图等MCP扩展;阿里在支付宝等产品中集成了MCP协议,其最新发布的Qwen3系列模型也原生支持MCP。


MCP的普及,为Agent生态的构建和运转提供了重要通路。国内外AI厂商们基本都推出了自家的MCP平台,邀请更多的开发者、应用服务商进驻。例如,360旗下的纳米AI最近上线“万能工具箱”,已有超100个自研和优选MCP工具,并且更多第三方MCP工具正在进驻中。


当MCP打破工具调用壁垒,智能体开发正进入"乐高积木"时代。这场战役的胜负关键已从技术突破转向生态构建能力。正如移动互联网催生APP经济,AI Agent正在开启智能体经济的黄金十年。


文章来自于“青澄财经”,作者“青沐”。


大厂围猎AI智能体

1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


3
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


4
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

IOS下载
安卓下载
微信群
沪ICP备2023015588号