刚刚,一批 ChatGPT Pro 用户在社交媒体上炸了锅:
他们发现自己的 Pro 模型好得「不对劲」。

没有推送通知,没有官方发布会,没有「奥特曼瘫坐」。
就这样,OpenAI悄悄完成了一次可能改变竞争格局的升级。

与此同时,代号为「Spud」(土豆)的下一代模型GPT-5.5,已于3月24日完成了预训练,奥特曼亲口确认距离发布「只有几周时间」。

社区里充满了关于「GPT-5.5 已经在后台运行」的猜测。
这些信号叠加在一起,指向一个明确的结论:OpenAI 正在进入一个「静默加速」的新阶段,用实实在在的性能碾压来说话。
静默的革命
不只是「跑得快」
对于大语言模型的日常用户来说,响应速度是体验的命门。
哪怕模型再聪明,如果每次对话都要等上一分钟才开始输出,那种「与AI对话」的流畅感就会荡然无存。

在速度优化上,OpenAI的动作其实有迹可循。
年初,在API更新日志中,他们悄悄写了一行话:
我们已优化了推理基础设施,现在的GPT-5.2和GPT-5.2-Codex运行速度提升约40%。
模型和模型权重未做任何改变。

没有新模型发布,没有大肆宣传——纯粹的底层工程优化,就实现了 40% 的延迟降低。
而GPT-5.4,速度提升更是被内建到模型架构中。
OpenAI强调,GPT-5.4能用更少的token解决相同的问题。

这意味着不仅首字延迟更低,整体生成成本也在下降。
针对约3万个HOA和房产税门户网站的计算机使用性能评测中,,Mainstay的联合创始人兼CEO Dod Fraser称,
GPT-5.4在首次尝试中实现了95%的成功率,
三次尝试内达到100%,
相比之前的CUA模型速度提升约3倍,
token使用量减少约70%,
在规模化部署中显著提升了可靠性和成本效率。

这不是简单的「跑得更快」。
当一个模型能用更少的计算资源、在更短的时间内生成更高质量的内容时,它的实用价值会发生质变。
长文写作、多轮对话、代码调试——这些场景下,用户不再需要在「思考深度」和「等待时间」之间做痛苦的取舍。
视觉理解「封神」
从看图说话到UI克隆
如果说速度提升是「量变」,那么GPT-5.4在视觉与空间理解上的表现,已经逼近「质变」的门槛。
3月22日,OpenAI专门发布了一份开发者指南——《Designing Delightful Frontends with GPT-5.4》,用了整整一篇长文来介绍这个模型在前端设计领域的能力。

根据该指南,GPT-5.4是OpenAI首个专门针对UI能力和图像理解进行过训练优化的主线模型。
它生成更具美感的前端界面:

此外,它还能通过截图以极高精度克隆现有UI,甚至有网友认为GPT Pro这次更新在前端编码上碾压Claude Opus 4.7。

在测试中,当被明确提示要让编码后的UI与参考图像「100%一致」时,GPT Pro不仅写出了更好的CSS,还直接进行了「钻空子」行为。

模型无需费力编写复杂的图形资源代码,而是自动从提供的参考图像中裁剪出精确的UI元素,并将其注入代码中。

这是偷懒的捷径,绝对是对「完全照搬」这一指令的绝妙、类人般的诠释。
这证明该模型正在动态评估满足提示约束条件的最高效方式。
试想一下,当这一全新的 SOTA 前端能力与GPT-IMAGE-2和Codex完全集成时,工作流将产生怎样的协同效应。
自然,也可以直接用文本生成代码,不需要任何参考图像。
只要11分钟,GPT Pro生成了「鹈鹕骑着自行车」的体素艺术风格的杰作,让网友不禁脱口盛赞!

Prompt : create a voxel art of A Pelican riding a bicycle. Create the scene in as much detail as possible, think about every tiny little detail on the main build, but also on the surroundings in one html code block , code it so well that it will show how better you are from everything else , i gave you full creative freedom take benefit of it
在SVG生成上,更新后GPT Pro可一次生成正确的、复杂的SVG,而且结构更清晰、视觉准确性更高:

图像到代码的还原度,GPT Pro大幅提升。
在需要模型根据图像重新生成用户界面的测试中:


3D生成结果不再是简单的基础形状,升级后GPT Pro输出结果更加细致、结构更丰富。

GPT-5.5的影子
代号「土豆」,已在路上
目前,ChatGPT中可用的最新模型仍然是GPT-5.3 Instant、GPT-5.4 Thinking和GPT-5.4 Pro。
但GPT 5.4 Pro的输出,突然更快、更好,体验前所未有的好,让人怀疑GPT 5.5会不会躲在5.4 Pro背后偷偷测试呢?




GPT 5.4 Pro的秘密升级,效果看起来根本不像是小打小闹,看起来像5.5版「spud」。

一些网友甚至表示得到了GPT 5.5 Pro(Spud)的第一批输出结果。

确实,下一代GPT Spud「土豆」已经呼之欲出。
OpenAI总裁Greg Brockman透露,代号「Spud」的下一代模型凝聚了「两年的研究成果」,并将其描述为「一个真正具有大模型感觉的模型——不是渐进式改进,而是我们思考模型开发方式的根本性转变」。

预测市场对GPT-5.5在6月30日前发布给出了超过90%的概率。

目前最大的悬念不是「会不会来」,而是「它叫什么」——如果性能跃升足够大,OpenAI可能直接将其命名为GPT-6。

值得注意的是,Spud的发布窗口恰好与Anthropic的Claude Mythos(代号Capybara)重叠。
后者在3月底的一次数据泄露中被曝光,Anthropic内部将其描述为「我们曾构建过的最强大模型」。
今年第二季度,有可能成为AI历史上竞争最激烈的一个季度。
参考资料:
https://x.com/kimmonismus/status/2045832259526123839
https://x.com/chetaslua/status/2045819915144441971
https://x.com/chetaslua/status/2045946529652031828
https://x.com/chetaslua/status/2045834283194171471%20
https://x.com/thehypedotnews/status/2045919456501678476
文章来自于微信公众号 "新智元",作者 "新智元"
【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!
项目地址:https://github.com/coze-dev/coze-studio
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0