独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。

AITNT
正文
资源拓展
独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。
2025-09-01 11:59

昨天,美团低调地开源了其560B参数的混合专家(MoE)模型——LongCat-Flash。


一时间,大家的目光都被吸引了过去,行业内的讨论大多围绕着它在公开基准测试中媲美顶尖模型的性能数据,以及其精巧的MoE架构设计。


然而,当大多数人还在逐行对比评测分数,分析其技术报告中那些半公开的秘密时,真正的故事线,其实隐藏在水面之下。


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


如果只把它看作是又一个大厂的技术“肌肉秀”,那就完全错判了这只龙猫的战略意义。


一个核心问题始终盘旋在许多人心中:一个主营外卖、酒旅和本地生活的公司,为何要如此坚定地投入一场看似与主业无关的、耗资巨大的大模型“军备竞赛”?


它图什么?


答案,并不在那些光鲜的PPT和技术文档里。


经过我们与多方信源的交叉确认,我们得以拼接出这盘棋局的全貌。


它关乎两个关键的内幕信息,而这两个信息,不仅解释了美团的动机,更可能预示了这场如火如荼进行中的外卖大战(本地生活)的最终结局。


首先, LongCat-Flash的训练并非在英伟达GPU上完成。


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


在其官方报告中,美团使用了“数万个加速卡”的模糊表述。


由于一些原因,该硬件厂商的具体名字不方便透露。


但这背后传递的信息已经足够清晰:


在AI的军备竞赛中,美团已经成功跑通了一条不被“卡脖子”的技术路径。


这并非易事,甚至可以说是极其艰难。


事实上,美团并不是第一家尝试在“异构加速卡”上进行大规模训练的公司。


就在前段时间,蚂蚁集团也曾公开分享过他们在这条路上的探索与挣扎。


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


根据蚂蚁相关研发负责人的说法,国产加速卡在稳定性和精度上存在诸多挑战,这给模型训练带来了巨大的困难。


例如,为了保证训练的正确性,团队需要投入无数个通宵去进行繁琐的算子精度对齐和框架调试。


更棘手的是,硬件的不稳定时常会导致训练过程中出现“loss尖刺”或“梯度异常”,这些问题会严重干扰模型的收敛,甚至让数周的训练成果毁于一旦。


然而,正是在这样的背景下,美团的成功才显得尤为突出。


他们不仅克服了这些业界公认的技术难题,还在一个560B参数的庞然大物上,于短短30天内实现了稳定高效的训练。


这证明了美团的技术团队不仅有能力追赶前沿,更有能力在复杂的约束条件下,深入底层去解决核心的系统工程问题。


这是一种比单纯发布模型参数更稀缺、更具价值的“软实力”。


回到大家所关心的那个问题,美团为何要如此坚定地投入一场外人看来“非主业”的战争?


这个问题的答案,其实美团CEO王兴在不久前的年报电话会上,已经给出了清晰的战略框架。


王兴将美团的AI战略阐述为三个层次:


首先是 工作中的AI(AI at Work) ,用以提升内部员工的生产力;


其次是 产品中的AI(AI in Products) ,用AI升级现有服务并推出全新的AI原生产品;


最后,也是这一切的基石,是 自研大语言模型(Building LLM) 。


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


LongCat-Flash的诞生,正是第三层战略的直接体现。


但它的最终目的,是为了服务于第二层战略——打造革命性的AI产品


在这个战略蓝图下,由美团核心本地商业CEO王莆中公开确认正在打造的“ 专属生活小秘书 ”,就是那个最核心的AI原生产品


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


这个“生活小秘书”并非简单的聊天机器人。


它的核心任务,是精准地执行一系列与现实世界紧密绑定的高价值操作:预订餐厅、购买电影票、下单外卖、规划行程。


这些任务对成功率的要求极为苛刻——推荐错一部电影无伤大雅,但订错一家餐厅、点错一份外卖,就是一次严重的服务失败。


这就解释了美团为何必须自研模型。


通用闭源或开源模型,无论多么强大,都无法满足这种对垂直场景的极致理解和近乎100%的执行可靠性。


因此,唯一的路径,就是执行王兴提出的第三层战略:训练一个属于自己的模型


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


一个从诞生之初就浸泡在美团自身数据和业务逻辑中的模型,一个能确保高可靠性的模型。


这,就是LongCat家族被创造出来的根本原因。


它不是一个泛泛的通用模型,而是美团AI战略从底层(Building LLM)到应用层(AI in Products)的必然结果,是为“生活小秘书”这个战略级产品量身打造的专属引擎。


其在Agent(智能体)能力上的重点投入,正是为了确保它能精准无误地理解指令,并调用海量API完成现实世界中的复杂任务。


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


所以,美团投入重金,并非在追逐一个模糊的“AI终局”,而是在为一个清晰、具体、且关乎未来的核心产品,打造不可或缺的发动机。


当我们将这两个内幕信息拼接在一起,本地生活服务市场的未来格局,似乎已经清晰可见。


这场战争的胜利,需要两个前提


一、有必须用AI来改造的、足够庞大且复杂的业务场景;


二、有能力、有意愿,并且有决心去不计代价地投入AI。


现在,让我们环顾牌桌上的主要玩家。


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


最执着的挑战者阿里 ,始终将本地生活作为核心战略之一。


但多年鏖战之下,它始终未能从根本上动摇美团在“吃”这个核心场景的统治地位,技术与业务的融合效果仍有待市场检验。


另一位重量级选手京东 ,则选择了一条差异化的进攻路线。


它依托其强大的自营供应链,以“小时购”为尖刀,猛攻“万物到家”的即时零售 。


这是一场精准的侧翼打击,但在“生活服务”这个更广阔的领域,其场景的丰富度和用户心智的占有率,与美团相比仍有差距。


这引出了一个更深层的问题:外卖大战或者说本地生活的终局,究竟由什么决定?


答案已经不再是流量、补贴或是地推团队的规模。


那个属于互联网上半场的旧剧本,正在被快速翻页。


真正的决胜点,在于谁能为这个连接着亿万用户、数百万商家和骑手的庞大物理世界 ,安装一个最高效、最智能的“大脑”。


这个“大脑”,就是AI。


独家|美团刚刚开源的龙猫大模型,其训练时未使用英伟达GPU。


它不再是一个锦上添花的工具,而是深入毛细血管的神经网络。


它的任务,不是在屏幕上展示更多的信息,而是在现实中调度每一次外卖、规划每一次出行、完成每一次预订。


它考验的,是一家公司将数字世界的指令,转化为物理世界精准服务的终极能力。


在这场终极能力的竞赛中,美团手握着两张无可比拟的王牌: 最庞大的物理世界网络 ,以及为这个网络打造专属大脑的决心与能力。


因此,LongCat-Flash的发布,远不止是一次技术实力的展示。


当竞争对手还在思考如何获取更多线上用户时,美团已经在思考如何用AI更深度地改造物理世界。


这只“龙猫”的到来,或许不仅仅是为了终结一场商业战争。


它真正要开启的,是一个由AI全面接管物理世界服务的全新时代。


让我们一起,且听龙吟吧。


文章来自于微信公众号“01Founder”,作者是“一直在路上的Max”。


1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

添加客服微信openai178,进AITNT官方交流群
IOS下载
安卓下载
微信群