速递|「华为天才少年」领衔、核心全员清北,Philo AI 完成近千万美金首轮,定义「世界生命模型」新物种

首页 AI资讯 AI技术研报 AI监管政策 AI产品测评 AI商业项目 arena全球大模型排行榜 AI产品热榜 AI 源力市场 AI新闻日报
下载 AITNT APP
🍎 iOS 下载 🤖 Android 下载

速递|「华为天才少年」领衔、核心全员清北,Philo AI 完成近千万美金首轮,定义「世界生命模型」新物种
AI资讯 2026-07-02 11:10
+8856 阅读

速递|「华为天才少年」领衔、核心全员清北,Philo AI 完成近千万美金首轮,定义「世界生命模型」新物种


据 Z Finance 获悉,由清华博士、华为「天才少年」张家声领衔的 AI 初创公司 Philo AI 已完成近千万级美金首轮融资,由祥峰投资(Vertex Ventures)独家投资。张家声此前主导的视频模型曾登上 Artificial Analysis 全球第 2,而这支核心成员全员清北博士的团队一向低调。本轮资金将重点用于世界生命模型的核心研发、自有系统构建与核心团队扩张。


当大厂顶尖技术人才正加速流向 AI 创业,Philo AI 的团队配置,几乎是一份“豪华到不真实”的名单:多位华为「天才少年」、腾讯「技术大咖」、大厂资深技术与产品专家,核心技术团队全员清华、北大博士。比融资本身更值得关注的,是这群人决定一起去做的那件事,一个他们称之为「世界生命模型」的新物种。


  一份“豪华到不真实”的名单:天才少年、全员清北博士、5000 卡、把 AI 送上太空冷门方向的起点


这支团队的核心,是创始人张家声。清华大学交叉信息研究院(IIIS)计算机博士,2023 年入选华为「天才少年」。但真正让他进入 AI 视频赛道的,是一款叫 Avenger 的视频模型:在创立 Philo AI 之前,他用8个月把这款模型做进全球前三,2025 年 10 月在 Artificial Analysis 的 Image-to-Video 权威榜单上登上全球第 2一个从清华实验室走出来的年轻人,用极小的成本挤进了全球视频生成的最前排。


而聚集在他身边的,是一支几乎把你能想到的顶尖标签都集齐了的团队。有人 17 岁考入清华、25 岁拿下港大博士,师从两位院士,做着 AI × 高性能计算 × 遥感的交叉研究,把 AI 送上过太空有人是系统方向的华为「天才少年」,能从单卡算子一路打到万卡集群,曾给一个集群业务一行命令解除瓶颈、性能直接翻了三倍有人数学竞赛保送、北大本博连读,把 CUDA 算子和编译器优化抠到芯片级;有人带过 5,000 卡的 VLLM 训练集群;有人负责过 10 PB 级的数据工程;还有人深耕强化学习与实时调度算法。


把这群人放在一起,是一个近乎夸张的事实:由「天才少年」和「技术大咖」领衔、核心团队全员清华北大博士,从算法、训练到推理工程、系统与产品,全栈没有一块短板。这种人才密度,在今天的 AI 创业团队里十分少见。


但真正稀缺的,远不是标签的简单相加,真正重要的是算法与工程在同一群人脑子里被彻底打通。Philo AI 敢把“看似不可能”做成,靠的不是堆算力,而是把极致加速建立在对算法的深刻理解之上:只有把模型吃到最透,才知道哪一步能压缩、能省、能并行,系统优化才有的放矢。算法理解得越深,加速就优化的越极致。一个对算法没有彻底理解的团队,再多的卡也换不来这种工程效率。


而这种能力最直接的证明,是速度。创始团队那种“8 个月做进全球前三”的爆发力和天赋,如今在 Philo AI 延续:团队在验证全双工方向时,仅用一周就跑通了实时互动。这种速度是“深刻理解算法 + 全栈打通工程”叠加后的自然结果。


 他们押注的新物种:世界生命模型


那么,这群人到底要做什么?答案是一个极富想象力的概念:世界生命模型(World Life Model)它既不是简单的视频生成,也不是对话式 AI,而是以实时双向视频为交互本体,创造能感知、能记忆、会主动、可共生的数字生命团队将其概括为三维同时成立:(视频形态与感知)、(记忆与情感)、(主动行为与关系演化)。


这与常见的“数字人”有本质区别。后者多建立在 3D 建模、动捕与预设脚本之上,本质是“驱动一个外壳”;而世界生命模型由基座模型端到端实时生成形象、表情与行为,感知、记忆与主动性内生于模型本身。两者是代际级技术差异,而非同路线迭代。


围绕世界生命模型,团队的思考其实收敛成两条主线。


主线一:把加速推到极致,质变就会发生


第一条,是一个非常第一性的技术判断:当视频的实时推理被推进到一个全新的区间,量变就会引发质变。


今天的视频模型是单向的:输入 prompt、等待、拿到一段视频,交互在生成之前就结束了。但 Philo AI 相信,借助持续的算法优化与一系列自研技术创新,一旦实时生成的延迟低到某个临界点、推理成本压到某个临界点,视频就会从“一段被生成出来的内容”,跃迁为“一个一直在线、能实时双向交互的存在”。这就是全双工(Full Duplex):人与数字生命同时在线、并行收发,模型持续感知、回应,并在用户参与下不断演化;从回合制到连续交互,从被动执行到主动判断何时回应或沉默,从一次性生成到一直在线、随时进入离开、回来时仍在演化。


这一判断正被全球最前沿的团队印证。前 OpenAI CTO Mira Murati 创立的 Thinking Machines Lab 近期提出「交互模型(Interaction Models)」,同样主张交互须原生于模型、实现全双工。不同的是,Philo AI 从第一天就锚定视频模态,把全双工直接做进视频本体。而能不能跨过那个临界点,恰恰取决于团队最稀缺的那种能力:把对算法的深刻理解,转化成别人给不出的推理效率。


主线二:不只是升级现有场景,更要创造新的可能


第二条,关乎这件事能长成多大。


一方面,这项技术可以无缝接入今天已经存在的场景,互动影游、直播、社交、泛内容平台都能被大幅提升:让 AI 不再是工具栏里的一个按钮,而是能感知你、回应你、与你共处的角色,把“情绪价值”和“实时响应”这两件当前生成式 AI 最薄弱的事补上,更深地嵌进这些体验里,带来新的价值。


但真正让团队兴奋的,是另一面:它会创造出今天还不存在的可能。当数字生命能够实时、双向、持续地与人共处,许多过去无法成立的体验会第一次成立,甚至会长出全新的场景、全新的产品、全新的互动与生活方式。团队真正追求的,从来不是把旧场景做得更好,而是去定义那些还没有名字的新场景


数字生命,一直是人类对 AI 终极形态的畅想。从《银翼杀手 2049》的「Joi」到《流浪地球 2》的「图丫丫」,描摹的都是一个能长期陪伴、可共生的存在。Philo AI 想做的,正是把这样的科幻变成现实。而团队真正要回答的那个问题是:视频模型的智能上限究竟在哪里。正如他们一再表达的,终极愿景是实现视频模态的 AGI


 结语


人才、算力、算法、工程、产品的多重优势汇聚一身,让 Philo AI 拥有了挑战行业代际变革的底气。以世界生命模型重构数字生命底层逻辑,他们跳出了现有 AI 应用的边界,坚定奔赴视频模态 AGI 的长远目标。据悉,Philo AI 的新一轮融资目前也已接近尾声。


大厂顶尖人才奔赴 AI 创业的浪潮仍在持续。



文章来自于微信公众号 “Z Finance”,作者 “Z Finance”

1
数字人

【开源免费】Fay开源数字人框架是一个AI数字人项目,该项目可以帮你实现“线上线下的数字人销售员”,

“一个人机交互的数字人助理”或者是一个一个可以自主决策、主动联系管理员的智能体数字人。

项目地址:https://github.com/xszyou/Fay

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

3
无人直播

【开源免费】VideoChat是一个开源数字人实时对话,该项目支持支持语音输入和实时对话,数字人形象可自定义等功能,首次对话延迟低至3s。

项目地址:https://github.com/Henry-23/VideoChat

在线体验:https://www.modelscope.cn/studios/AI-ModelScope/video_chat


【开源免费】Streamer-Sales 销冠是一个AI直播卖货大模型。该模型具备AI生成直播文案,生成数字人形象进行直播,并通过RAG技术对现有数据进行寻找后实时回答用户问题等AI直播卖货的所有功能。

项目地址:https://github.com/PeterH0323/Streamer-Sales

添加客服微信openai178,进AITNT官方交流群