AGI是否需要世界模型?顶级AI专家圆桌论道,清华求真书院主办

搜索
AI-TNT
正文
资源拓展
AGI是否需要世界模型?顶级AI专家圆桌论道,清华求真书院主办
2025-07-28 16:08

2025年7月20日,2025基础科学与人工智能论坛在中关村展示中心会议中心举行。


AGI是否需要世界模型?顶级AI专家圆桌论道,清华求真书院主办


清华大学人工智能研究院常务副院长孙茂松教授主持,北京中关村学院院长、中关村人工智能研究院理事长刘铁岩博士、清华大学电子工程系主任汪玉教授、美国纽约州立大学石溪分校顾险峰教授、曦智科技创始人兼CEO沈亦晨博士四位顶尖AI专家齐聚一堂,围绕人工智能的根本问题展开了一场火花四溅的讨论。


从因果性到原创能力,从算力瓶颈到未来架构,这场论坛为我们勾勒出AI技术的前沿图景与未来挑战。


共有500名来自清华大学求真书院、北京各高校、中学和科研机构的观众到场。


此外,本次论坛还是2025国际基础科学大会的特别活动之一,由清华大学求真书院主办,中信证券股份有限公司与中关村科学城管理委员会协办。


现已连续举办3届,旨在推动交叉学科合作交流,为青年学生搭建了了解科研前沿、激发探索兴趣的平台。


我们将论坛交流内容整理如下:


相关性≠因果性:AI系统的科学化门槛仍在


面对人工智能技术发展的瓶颈与限制顾险峰教授指出,目前AI技术在方法上仍以“相关性”建模为主,缺乏对“因果律”的深刻掌握。


他认为,缺乏因果建模的能力是当前AI在自然科学、数理建模等任务上受到限制的原因。


同时他也强调,真正的科学建模需要简约假设、逻辑自洽的因果体系,不能仅靠大量数据推导模式。


刘铁岩教授则补充称,虽然大模型底层是统计学习的结构,但在高层语义表达中已出现“因果性功能的涌现”,例如在处理逻辑推理、数学解题、文本论证等任务时,大模型展现出了“因为……所以……”的结构理解能力。


他呼吁对因果性的层次与表达保持开放态度,建议从“语义因果性”角度重新评估当前模型的能力边界。


AGI是否需要世界模型?顶级AI专家圆桌论道,清华求真书院主办


Token范式的尽头:AI模型是否需要世界模型?


与会专家还就“Next Token Prediction是否是通往通用智能的正道”展开讨论。


孙茂松教授率先提出疑问:文本是天然一维的,图像是二维的,视频再加一维时间,世界则是四维的。当认知对象越来越复杂,是否需要彻底摒弃token预测,转向“世界模型”等新范式?


对此,汪玉教授持乐观态度。


他认为,“语言本身是人类认知的表达系统”,图像、视频、物理结构等都可以在二维语言序列中进行展开。


基于此,他提出一个“可描述性”的新边界概念:如果人类能够通过语言准确描述某一对象或规律,AI就有可能通过token prediction模型学会它;如果人类尚未找到语言描述方式,则AI也难以捕捉。


刘铁岩教授对此也补充道,“next token prediction 实际上是语言理解和创作领域的极佳范式”,其泛化能力远超以往所有任务特定模型。


但当AI任务转向如偏微分方程求解、量子系统建模、工业优化等非语言任务时,“当前范式将无法胜任,需要全新学习目标与系统架构。”


AI能否“原创”?推理与建模能力仍不可替代


其次,学者们还进一步聚焦于AI是否具备“原创能力”


顾险峰教授直言:


在科学研究中,重大理论的提出绝非数据堆积所能催生。


另外他以自己学习拓扑学为例指出:


最关键的一步转化,AI永远抓不住。


他强调,科学进步来自“对未知现象的预判与假设”,而非对已知结构的不断模仿。


沈亦晨博士以围棋为喻指出,尽管围棋规则简单,但由于搜索空间巨大(约10^360),“纯靠套路是不足以解决全部问题的。”


他区分了“90%可类推问题”与“10%原创性突破问题”,认为AI可以在大多数工程化问题中大显身手,但在人类科学的“皇冠上的明珠”领域,目前仍力有未逮。


刘铁岩教授则从产业视角提出:


即便AI无法做到“无中生有”,但它在已知边界上的全覆盖与组合重构,仍将对科学研究产生深远影响。


他认为未来AI将在“从类比中发现新结构”方面具有巨大潜力,尤其是在AI for Science的具体子任务中表现出色。


高能效计算是AI基础设施的下一场革命


面对当前大模型对算力的依赖已呈指数增长的问题,孙茂松教授引用数据显示,最新一代大模型训练耗资约达100亿美元,需20万张GPU卡支持,预计2035年将可能突破至1亿张卡。


沈亦晨回应称:


未来未必真的需要1亿张卡,但百万卡级别的计算已成为现实挑战。


他介绍了曦智科技在光互联和光计算芯片方面的进展:


通过光作为连接介质,可以极大提升芯片间通信带宽与效率,解决分布式模型训练中“多芯片如一芯片”的问题。


他进一步强调,要充分发挥光计算的高能效优势,需在算法层面推动向低精度(int4/int8)模型优化。


汪玉补充指出,“未来的关键是让底层硬件异构对开发者透明。”即芯片无论是电计算还是光计算,对开发者应“看起来就是一台机器”,从而保障工程系统的稳定性与迁移效率。


刘铁岩则抛出一种范式设想:


真正的人工智能下半场,将是“Experience-driven AI”。


他设想一个分布式交互学习系统,由100万个机器人在物理世界中实时感知、同步数据和模型权重,实现全域智能协同。


这将超越大模型集中训练范式,形成全新的进化路径。
圆桌论坛精彩纷呈、交锋密集,无论是从“相关性与因果性”的基本认知出发,还是围绕“token预测范式”的边界问题,亦或是对“原创能力”与“算力极限”的前景评估,专家们均展现出深厚的理论思考与实践视角。


正如孙茂松教授在总结中所说:


大模型的有效性是经验主义的,但它的问题也是根本性的。真正的突破,有赖于我们在理论与系统两端都迈出新的一步。


文章来自于“量子位”,作者“胥森哲”。

添加客服微信openai178,进AITNT官方交流群
IOS下载
安卓下载
微信群
沪ICP备2023015588号