速递｜「华为天才少年」领衔、核心全员清北，Philo AI 完成近千万美金首轮，定义「世界生命模型」新物种

AI资讯 2026-07-02 11:10

+8856 阅读

据 Z Finance 获悉，由清华博士、华为「天才少年」张家声领衔的 AI 初创公司 Philo AI 已完成近千万级美金首轮融资，由祥峰投资（Vertex Ventures）独家投资。张家声此前主导的视频模型曾登上 Artificial Analysis 全球第 2，而这支核心成员全员清北博士的团队一向低调。本轮资金将重点用于世界生命模型的核心研发、自有系统构建与核心团队扩张。

当大厂顶尖技术人才正加速流向 AI 创业，Philo AI 的团队配置，几乎是一份“豪华到不真实”的名单：多位华为「天才少年」、腾讯「技术大咖」、大厂资深技术与产品专家，核心技术团队全员清华、北大博士。比融资本身更值得关注的，是这群人决定一起去做的那件事，一个他们称之为「世界生命模型」的新物种。

一份“豪华到不真实”的名单：天才少年、全员清北博士、5000 卡、把 AI 送上太空冷门方向的起点

这支团队的核心，是创始人张家声。清华大学交叉信息研究院（IIIS）计算机博士，2023 年入选华为「天才少年」。但真正让他进入 AI 视频赛道的，是一款叫 Avenger 的视频模型：在创立 Philo AI 之前，他用8个月把这款模型做进全球前三，2025 年 10 月在 Artificial Analysis 的 Image-to-Video 权威榜单上登上全球第 2。一个从清华实验室走出来的年轻人，用极小的成本挤进了全球视频生成的最前排。

而聚集在他身边的，是一支几乎把你能想到的顶尖标签都集齐了的团队。有人 17 岁考入清华、25 岁拿下港大博士，师从两位院士，做着 AI × 高性能计算 × 遥感的交叉研究，把 AI 送上过太空；有人是系统方向的华为「天才少年」，能从单卡算子一路打到万卡集群，曾给一个集群业务一行命令解除瓶颈、性能直接翻了三倍；有人数学竞赛保送、北大本博连读，把 CUDA 算子和编译器优化抠到芯片级；有人带过 5,000 卡的 VLLM 训练集群；有人负责过 10 PB 级的数据工程；还有人深耕强化学习与实时调度算法。

把这群人放在一起，是一个近乎夸张的事实：由「天才少年」和「技术大咖」领衔、核心团队全员清华北大博士，从算法、训练到推理工程、系统与产品，全栈没有一块短板。这种人才密度，在今天的 AI 创业团队里十分少见。

但真正稀缺的，远不是标签的简单相加，真正重要的是算法与工程在同一群人脑子里被彻底打通。Philo AI 敢把“看似不可能”做成，靠的不是堆算力，而是把极致加速建立在对算法的深刻理解之上：只有把模型吃到最透，才知道哪一步能压缩、能省、能并行，系统优化才有的放矢。算法理解得越深，加速就优化的越极致。一个对算法没有彻底理解的团队，再多的卡也换不来这种工程效率。

而这种能力最直接的证明，是速度。创始团队那种“8 个月做进全球前三”的爆发力和天赋，如今在 Philo AI 延续：团队在验证全双工方向时，仅用一周就跑通了实时互动。这种速度是“深刻理解算法 + 全栈打通工程”叠加后的自然结果。

他们押注的新物种：世界生命模型

那么，这群人到底要做什么？答案是一个极富想象力的概念：世界生命模型（World Life Model）。它既不是简单的视频生成，也不是对话式 AI，而是以实时双向视频为交互本体，创造能感知、能记忆、会主动、可共生的数字生命。团队将其概括为三维同时成立：身（视频形态与感知）、心（记忆与情感）、行（主动行为与关系演化）。

这与常见的“数字人”有本质区别。后者多建立在 3D 建模、动捕与预设脚本之上，本质是“驱动一个外壳”；而世界生命模型由基座模型端到端实时生成形象、表情与行为，感知、记忆与主动性内生于模型本身。两者是代际级技术差异，而非同路线迭代。

围绕世界生命模型，团队的思考其实收敛成两条主线。

主线一：把加速推到极致，质变就会发生

第一条，是一个非常第一性的技术判断：当视频的实时推理被推进到一个全新的区间，量变就会引发质变。

今天的视频模型是单向的：输入 prompt、等待、拿到一段视频，交互在生成之前就结束了。但 Philo AI 相信，借助持续的算法优化与一系列自研技术创新，一旦实时生成的延迟低到某个临界点、推理成本压到某个临界点，视频就会从“一段被生成出来的内容”，跃迁为“一个一直在线、能实时双向交互的存在”。这就是全双工（Full Duplex）：人与数字生命同时在线、并行收发，模型持续感知、回应，并在用户参与下不断演化；从回合制到连续交互，从被动执行到主动判断何时回应或沉默，从一次性生成到一直在线、随时进入离开、回来时仍在演化。

这一判断正被全球最前沿的团队印证。前 OpenAI CTO Mira Murati 创立的 Thinking Machines Lab 近期提出「交互模型（Interaction Models）」，同样主张交互须原生于模型、实现全双工。不同的是，Philo AI 从第一天就锚定视频模态，把全双工直接做进视频本体。而能不能跨过那个临界点，恰恰取决于团队最稀缺的那种能力：把对算法的深刻理解，转化成别人给不出的推理效率。

主线二：不只是升级现有场景，更要创造新的可能

第二条，关乎这件事能长成多大。

一方面，这项技术可以无缝接入今天已经存在的场景，互动影游、直播、社交、泛内容平台都能被大幅提升：让 AI 不再是工具栏里的一个按钮，而是能感知你、回应你、与你共处的角色，把“情绪价值”和“实时响应”这两件当前生成式 AI 最薄弱的事补上，更深地嵌进这些体验里，带来新的价值。

但真正让团队兴奋的，是另一面：它会创造出今天还不存在的可能。当数字生命能够实时、双向、持续地与人共处，许多过去无法成立的体验会第一次成立，甚至会长出全新的场景、全新的产品、全新的互动与生活方式。团队真正追求的，从来不是把旧场景做得更好，而是去定义那些还没有名字的新场景。

数字生命，一直是人类对 AI 终极形态的畅想。从《银翼杀手 2049》的「Joi」到《流浪地球 2》的「图丫丫」，描摹的都是一个能长期陪伴、可共生的存在。Philo AI 想做的，正是把这样的科幻变成现实。而团队真正要回答的那个问题是：视频模型的智能上限究竟在哪里。正如他们一再表达的，终极愿景是实现视频模态的 AGI。

结语

人才、算力、算法、工程、产品的多重优势汇聚一身，让 Philo AI 拥有了挑战行业代际变革的底气。以世界生命模型重构数字生命底层逻辑，他们跳出了现有 AI 应用的边界，坚定奔赴视频模态 AGI 的长远目标。据悉，Philo AI 的新一轮融资目前也已接近尾声。

大厂顶尖人才奔赴 AI 创业的浪潮仍在持续。

文章来自于微信公众号 “Z Finance”，作者 “Z Finance”

数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目，该项目可以帮你实现“线上线下的数字人销售员”，

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址：https://github.com/xszyou/Fay

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。

项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

无人直播

【开源免费】VideoChat是一个开源数字人实时对话，该项目支持支持语音输入和实时对话，数字人形象可自定义等功能，首次对话延迟低至3s。

项目地址：https://github.com/Henry-23/VideoChat

在线体验：https://www.modelscope.cn/studios/AI-ModelScope/video_chat

【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案，生成数字人形象进行直播，并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址：https://github.com/PeterH0323/Streamer-Sales