那个去百度做模型的年轻人

AI资讯 2026-07-03 09:57

+8259 阅读

那个去百度做模型的年轻人

昨天，消息说孙天祥加入百度，担任基础模型研发部（BMU）负责人。

「elsewhere」最开始知道孙天祥，还是投资人韩锐跟我们说的。大概一年半之前，他说他投资了一个“young talent”，就是1997年的孙天祥。当时他刚离开阳陆育的公司。

他创办的公司叫日行迹。那是一家 AI4S 的创业公司。据我们了解，目前这家公司已被百度收购。

日行迹，取自天文学术语“日行迹”，指在一年中每天同一时间、同一地点拍摄太阳位置，并将这些位置连接起来所形成的近似“8”字形轨迹。公司 Slogan 是“在一个问题无限的世界里，我们需要构建无限心智”。

他最让我印象深刻的是，我已经很久没有如此密集地从一个人口中听到“AGI”。

比如，他创业前后，pass了视频模型方向的机会，因为“他觉得这与 AGI 无关”；比如，他想用 AI 研究 AI ，而这项工作目前还属于那些炙手可热的 AI 研究员们；比如，他觉得简洁的方法最有效，整个 AGI 可能就约等于一个能研究 AI 本身的语言模型；以及，他反反复复提到的他对非共识的相信和对变化的渴求。

那几次，我们还聊到了日行迹当时正在推进的融资，对国内 AI Labs 的观察，以及，他还曾向我们论证过，为什么他想做的事情，顶尖模型厂商很难完成。

孙天祥是山东人。他曾开玩笑和我们说，山东是“创业黑洞”，因为这是一个共识过于强烈的地方。而共识意味着大概率失败，尤其对于后来者。

一个 AI 顶尖人才，在今天加入百度，的确挺非共识的。我还没有问过孙天祥为什么。但对一个相信非共识的人来说，他应该看到了某些我们没有看到的东西。

AI for AI

日行迹原本构想的是：用 AI 来研究 AI。

要怎么理解这个概念呢？

目前，基础模型还很大程度依赖顶尖 AI 研究员们“手搓”，但这也意味着模型发展的瓶颈仍然在人类。孙天祥的观点是，一旦 AI 研究 AI 的能力达到人类水平，那 AI 能力的提升会获得更高的斜率。

类比人类研究员， AI 做研究同样也有两个部分：一个是 Innovator ——幻觉生成器，能在人类水平上规模化地产生研究假设；另一个是 Verifier ——实验 agent ，它在 GPU 集群里接受任意假设、写代码做实验，告诉你这个假设的结果会成为知识还是幻觉。

今年2月，日行迹刚做过一场长达200多小时的直播，由日行迹研发的 FARS （ Fully Automated Research System ）现场写出了100篇短论文。

简单来说，日行迹想做的是造“造 AI 的人”。更有野心地讲，是在造 DeepMind、DeepSeek、OpenAI 这样的组织能力本身。

NeoLab

我们一开始觉得，日行迹是不是一家有点科幻的 NeoLab ？

孙天祥的回答是克制的：“还算是一家 Lab 型的公司。”他认为，Lab 的氛围应该是纯粹的，没有自上而下的组织权利，更多是自下而上的专家权利——比如所有会议对所有人可见，比如可以自由地提出设想、组队研究。这也是他觉得 DeepSeek 有 Lab 气质之处。

我们当时也聊到了DeepSeek。他说，梁文锋的可贵在于：第一性、长期主义、不迷信外部（不迷信硅谷，不迷信海外人才）、以及有好的技术直觉。比如在2023 年，当许多人把多模态、视频和 AGI 绑定在一起时，梁文锋的判断就是：这些都不重要。

在这个基础上，他对 NeoLab 的定义是：做颠覆式创新的新技术范式。其中有一个关键特征是：技术上路径优势大于资源优势。

当然基于这些，孙天祥认为中国的真正的 Lab 其实很少，NeoLab 更是。

组织与人

不过比较反差的是，在此前和我们的对话中，他多次表达过，AI for AI 这样的范式迁移，很难在基模厂里自然长出来。

过去的一些年里，几乎所有基模团队都将组织和人才置于最高的优先级，顶尖研究员被国内外大厂哄抢。根本原因在于，模型训练的算力和时间成本极高，研究员的研究能力、研究品味、以及组织能否激发这些人，可能会让算力利用率、训练效率和模型能力拉开数量级的差距。

甚至有人认为，模型就是一种对最聪明的人类—— AI 研究员们——的蒸馏。

但一个组织很难对抗自己。人，是花重金挖到的；组织形态与文化，是不断调试出来的。如果 AI 真能做 AI 研究，它挑战的对象会从工具链延伸到今天由研究员构成的模型研发组织本身。所以，当前进展越快的组织，进入下一种范式的阻力就会越大。

而现在，孙天祥选择了百度。

百度

如所有人所知，百度对 AI 有多渴望。

前史不用赘述，只说一点：可能很少人会注意到，百度的最新一代基础模型是文心 / ERNIE 5.0 ，这个强调多模态能力的模型，发布于近9个月之前的——2025年11月。它之后还有过上下文和视频能力方面的更新。

很多人认为，今日之百度，缺乏的是创新能力和技术品牌号召力。

对于孙天祥来说，这是否反而是一个更大的机会：一个百废待兴的组织里，来了一个把重塑组织视作技术路线的人。

证明过就失去兴趣

童年时，因为家人工作变动，孙天祥转过好几次学。转学后，他通常能很快考到班里第一，但未必能维持很久。孙天祥反思过这个问题，结论是：当他证明过自己，就会丧失动力。

典型困境如高考。这种日复一日地坚持和卷，不是他喜欢的节奏。所以到了大一后，他觉得自己终于如鱼得水：想玩就玩，玩到想吐；他也重新从学习里找到快乐，开始花时间去图书馆看书。频繁切换状态反而让他更享受。

读博时，他有大量时间都在玩，可能花一个暑假追番、打游戏上分。在少数时间里，他会抱着热情和好奇去做事情。这种方式在复旦自由的氛围里仍然可行。2023年2月，他主导研发的MOSS大模型正式内测——这是中国首个公开内测的类ChatGPT模型。

这或许能解释他的许多选择：他不愿长时间维持共识赛道上的竞争，也不适合只做延长线工作；他需要不断证明一个新判断、进入一个变化更大的问题。

有一句话他说过很多次：人，应该去变化更大的地方。

封面来源：Joseph Wright of Derby, A Philosopher Lecturing on the Orrery, 1766, Derby Museum and Art Gallery

文章来自于微信公众号 “elsewhere别处发生”，作者 “elsewhere别处发生”

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。

项目地址：https://github.com/Henry-23/VideoChat

在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址：https://github.com/PeterH0323/Streamer-Sales