李彦宏:便宜已经不是DeepSeek的优势了

搜索
AI-TNT
正文
资源拓展
李彦宏:便宜已经不是DeepSeek的优势了
2025-04-26 11:08

如今,模型的发展已经成了应用开发者的一把双刃剑。一方面,模型能力的增强,给场景落地带来更多的可能;另一方面,应用的能力,也随时可能被模型能力本身淘汰。


什么样的应用不会过时?


2025年4月25日,百度Create大会上,百度集团创始人、董事长兼CEO李彦宏的答案是:“你只要找对场景,选对基础模型,有时候可能还要学一点调模型的方法,那么在这个基础上做出来的应用,它是不会过时的,应用才是真正创造价值的。”


在应用层,李彦宏认为2025年以来最令人激动的突破性的应用,是数字人和Agent。


卖数字人,是百度布局电商业务的重要一环。在会上,李彦宏发布了最新的数字人能力:高说服力数字人。除了更加拟人,“高说服力数字人”的特点,是可以感知直播间环境,并智能做出发红包、换品等决策。


百度在应用层的另一个布局重点,是Agent。


一年前,李彦宏曾表示,AI Coding是他最看好的应用方向。目前,百度在代码智能体领域已经做了较为完整的布局,有面向专业工程师的编程工具Comate,面向普通人的无代码编程工具“秒哒”。


而面向通用场景,前有Manus邀请码“一码难求”,百度也快马跟上,趁Manus收费之际,推出了一款移动端的Agent应用“心响”。


在模型层,DeepSeek是绕不过去的竞争对手。


“DeepSeek不是万能的。”李彦宏开门见山,“DeepSeek不支持多模态理解,有幻觉,更重要的是,慢和贵。”


对着DeepSeek的“短板”打,百度在Create发布了新模型:文心大模型4.5 Turbo和X1 Turbo,主打多模态,强推理,低成本。尤其是成本,4.5 Turbo的成本,是DeepSeek V3的40%,X1 Turbo的成本,是DeepSeek的25%。


最后,百度将自己的野心,也放到了AI应用生态的建立上。


一方面,百度搜索推出了开放平台,邀请应用开发者给予搜索生态开发AI应用;另一方面,百度对Anthropic发布的Agent协议MCP,进行了支持——这意味着,支持MCP的模型、外部工具和数据库之间,将能够畅通无阻的交互。


百度的“App版Manus”发布了


2025年3月6日发布的Agent应用Manus,又让AI Agent成为各家抢滩的应用高地。


4月22日,大会三天前,百度的首款独立Agent应用,已经上架了安卓应用商店。这款名为“心响”的App,形式可以简单理解为百度将Manus的移动端版本做了一遍。


用户只需在“心响”App中输入自己的需求,Agent就能对任务进行执行和交付。


李彦宏:便宜已经不是DeepSeek的优势了


“心响”制作绘本。来源:百度


此前,据百度智能体业务首席架构师、心响App负责人黄际洲介绍,“心响”的实现,背靠的是百度提出的Agent Use协议。此前,Anthropic提出的Agent协议MCP,针对的是工具的调用。


而“心响”采用的是对智能体的调用。根据用户的需求,“心响”的主智能体,能根据任务,调度第三方和百度自己的智能体,实现任务的执行和交付。


重建用户心智,在心响App产品经理黎宇昕看来,是百度做Agent产品时遇到的最大难点。


在媒体沟通会上,他提到,百度之前用搜索建立的用户心智,是及时交付。这意味着,AI应用“一定会折损效果,比如通过缓存的方式,去降模型调用的次数等等”——这也是市面上大多强调及时交付的Agent产品,无法实现高质交付的原因。


黎雨昕认为,“心响”要重新建立的,是托管心智。与Manus的任务可视面板类似,“心响”在任务执行过程中,也采用了分析流的形式,将任务执行的过程和时间,呈现给用户。


目前,心响已经支持包括200种类型的任务,覆盖了工作、学习、生活的主要场景,比如试题讲解、旅游、相亲、问诊、法律咨询。


黄际洲透露,未来,“心响”计划将支持的任务类型扩展到10万+以上。与此同时,“心响”PC端也正在研发中。


会画画的新推理模型,成本仅DeepSeek的25%


百度新发布的模型文心4.5 Turbo和X1 Turbo,相较于DeepSeek V3和R1的优势,除了整体性能的超越,主要在于多模态能力和低成本。


李彦宏:便宜已经不是DeepSeek的优势了


文心4.5 Turbo性能测评。来源:百度


李彦宏:便宜已经不是DeepSeek的优势了


文心X1 Turbo性能测评。来源:百度


其中,李彦宏强调了多模态理解的能力。他认为,多模态是未来基础模型的标配,“纯文本模型的市场会越来越小,多模态的市场会越来越大”。


文心4.5 Turbo和X1 Turbo,都对图像和视频理解进行了支持。


比如,输入一张高糊的球赛照片,文心4.5 Turbo能通过周边的广告牌、球员动作等元素,识别出这是1986年墨西哥的世界杯足球赛上,阿根廷与英格兰的决赛。


李彦宏:便宜已经不是DeepSeek的优势了


文心4.5 Turbo的图像理解能力。


除了多模态理解,两个模型也支持多模态生成。


比如,在文心X1 Turbo中输入“听说武汉有种东西叫‘蒜鸟’,请你把它画出来”,X1 Turbo就能根据联网搜索到的信息,生成蒜鸟的卡通形象。


至于价格,文心4.5Turbo价格仅为文心4.5的20%、DeepSeek V3的40%,每百万token的输入价格为0.8元,输出价格3.2元;X1 Turbo的价格仅为DeepSeek-R1的25%,每百万token输入价格1元,输出价格4元。


百度电商,做上游“卖水人”


AI重燃了百度对电商信心。


自2023年5月在百度App上线“百度优选”入口以来,百度对电商的定位,不是和淘宝、京东这些规模化的货架电商竞争。


百度副总裁、百度电商总经理平晓黎表示,百度电商有两个定位,一方面,是构成百度App服务的一环,满足搜索用户的消费需求;另一方面,是用智能工具服务,成为电商的上游“卖水人”。


数字人,就是百度电商卖的水。此次百度发布的“高说服力数字人”,除了在拟人、成本、风格等层面有所优化,最重要的是能够对直播间环境进行感知,并作出实时的互动,避免了传统数字人循环播放的尴尬局面。


比如,比如满50万人观看,就给观众发红包;根据直播间用户的问题,灵活调度PPT、切换素材。


李彦宏:便宜已经不是DeepSeek的优势了


“高说服力数字人”。来源:百度


实时互动背后的技术,是多智能体调度能力。据平晓黎介绍,高说服力数字人背后,有主播专家、运营专家、场控专家等多个角色智能体,能够根据直播间实时热度和转化情况,灵活调度。


AI月活超9700万的文库,想打模型组合拳


整合了百度网盘的文库,交出了半年答卷:付费用户数超4000万,月活超9700万。


在百度内部,百度文库是模型能力应用的尖子生。此前,百度副总裁、百度文库兼百度网盘负责人王颖告诉《智能涌现》,文库是最早自研MoE(混合专家模型)架构的AI应用。


当下,采用多模型组合的底座,已经成为AI应用的基操。李彦宏认为,应用对模型的组合使用,是普遍的现象,但如何组合、如何调用,仍然是一门技术活。


为此,百度文库和网盘推出了一个技术底座:沧舟OS。


李彦宏:便宜已经不是DeepSeek的优势了


沧舟OS。


为了实现不同模型对不同内容的理解和生成,这个底座,主要分成两层:


第一层,Chatfile Plus。其能够对不同模态、不同形态、不同格式的内容进行“向量化处理”,也就是将不同内容翻译成大模型能看得懂的向量化Token,在进行混合生成。


第二层,三库+三器,也就是“公域知识库、私域知识库,记忆库”,以及“编辑器、阅读器和播放器”。这一套系统,可以根据用户的需求,被大模型来组合调用。


基于这一套OS,百度网盘发布了新功能,AI笔记。


在百度文库看来,用户学习的一个痛点,是笔记内容与原始学习资料之间缺乏关联。比如用户根据笔记复习时,需要再花一番功夫,去寻找文本、视频、图片等资料。


AI笔记的核心功能,是时间溯源和多模态整理。比如,根据百度网盘中保存的视频讲解,AI笔记可以基于对内容的理解,梳理整个视频的逻辑结构和行文顺序,并生成思维导图。


导图中,每个知识点带的时间戳,都直接溯源到视频的相应节点。


李彦宏:便宜已经不是DeepSeek的优势了


百度网盘的“AI笔记”功能。


MCP,百度也接上了“AI万能插座”


MCP,是美国模型厂商Anthropic推出的Agent协议。


就像秦统一了货币,协议的作用,就是统一了软件之间的开发标准。支持MCP协议的软件之间,也可以更为灵活的适配、相互调用。比如,不少金融公司采用MCP,让AI更好地理解金融数据的上下文。

支持MCP,也成了厂商吸引更多第三方应用入驻、建立AI生态的一场“暗战”。比如,阿里云的AI开发平台“百炼”上线了MCP服务,腾讯云也宣布大模型知识引擎支持MCP协议。


在李彦宏看来,MCP就像给AI装上了一个万能插座,能够提高不同AI软件适配、开发、整合维护的效率。对于需要自由调用工具的Agent而言,MCP的出现尤为重要,这意味着Agent可以自由调用支持MCP的第三方工具。


目前,百度智能云大模型平台“千帆”兼容了MCP,百度搜索也构建了MCP Server的索引平台,文心快码、百度电商、地图、网盘、文库等应用,也通过MCP Server的形式,对外提供了能力。



文章来自微信公众号 “ 阿菜cabbage “,作者 周鑫雨


李彦宏:便宜已经不是DeepSeek的优势了


1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
cursor

【免费】cursor-auto-free是一个能够让你无限免费使用cursor的项目。该项目通过cloudflare进行托管实现,请参考教程进行配置。

视频教程:https://www.bilibili.com/video/BV1WTKge6E7u/

项目地址:https://github.com/chengazhen/cursor-auto-free?tab=readme-ov-file


3
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


4
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

5
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

6
知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。

项目地址:https://github.com/labring/FastGPT

7
RAG

【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址:https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。

项目地址:https://github.com/langgenius/dify


【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。

项目地址:https://github.com/infiniflow/ragflow/tree/main


【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目

项目地址:https://github.com/phidatahq/phidata


【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。

项目地址:https://github.com/TaskingAI/TaskingAI

8
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales

IOS下载
安卓下载
微信群
沪ICP备2023015588号