OpenAI：GPT-5就是All in One，集成各种产品

正文

资源拓展

2025-05-17 17:56

GPT-5将会集大成于一体？！

就在发布“最强编程智能体Codex”之后，OpenAI又接着在Reddit举行了“有问必答”活动。

OpenAI：GPT-5就是All in One，集成各种产品

公司研究副总裁Jerry Tworek，剧透了下一代基础模型GPT-5的最新消息：

为了减少模型切换，未来计划将Codex、Operator、Deep Research和Memory整合在一起。

OpenAI：GPT-5就是All in One，集成各种产品

除此之外，其他Codex团队成员也纷纷开启了爆料模式，比如：

Codex最初只是一个附带项目，启动原因是他们意识到在内部工作流中未充分利用好模型；

内部在使用Codex时，编程效率提升了约3倍；

OpenAI正在探索灵活的定价方案，包括按需付费；

o3-pro或codex-1-pro最终将在团队能力允许的情况下推出；

……

Okk，下面我们一起吃瓜。

OpenAI：GPT-5就是All in One，集成各种产品

回应10大重点问题

整体而言，OpenAI团队这次主要分享了Codex的详细情况，以及公司未来的发展计划。

为了尽量贴合问答者原意，我们直接以对话形式展开。

Q1: 为什么要用TypeScript编写Codex CLI工具，而不是Python？

A1: 因为开发者对TypeScript比较熟悉，而且它适合用于UI（包括终端界面）。

不过，未来会有一个高性能引擎，支持多种语言的绑定，开发者可以使用自己熟悉的语言进行扩展。

Q2: 为什么选择在云上运行代码，而不是在本地运行Agent（比如使用MCP）？

A2: 虽然Codex CLI可以在本地运行Agent，但受限于计算机性能，通常是单线程的。

而在云端运行可以实现并行化和沙盒化，这样可以让模型在无人监督的情况下安全地运行代码。

Q3: 团队在使用Codex时，发现了哪些与目前的“氛围编码（vibe coding）”不同的范式转变？开发这个工具的灵感是什么？

A3: 主要区别是可以同时生成大量代码版本，然后从中选择代码质量最好的版本。这就好比你可以培养一大批喜欢编程的小程序员，然后从中挑选出最佳代码版本。

事实上，Codex工具最初是一些工程师的业余项目，他们对在OpenAI的日常工作中没有充分利用模型感到沮丧，因此才想到要开发它。

Q4: GPT-5是否有可能不仅仅帮助编写代码，还能在计算机上完成更多任务？换句话说，它是否会成为一个真正的助手，而不仅仅是提供建议？

A4: GPT-5是我们的下一代基础模型，核心目标是提升现有模型的能力，减少模型切换。

目前已经有一个可以在计算机上执行任务的产品——Operator。虽然它目前仍处于研究预览阶段，但未来会进行改进，成为一个非常有用的工具。

未来计划是将现有的工具（如Codex、Operator、Deep Research、Memory）整合在一起，使它们感觉像一个整体。

OpenAI：GPT-5就是All in One，集成各种产品

Q5: Codex只适合高级工程师吗？

A5: 可能对那些想解决繁琐问题而非超级难题的人来说更合适。

Q6: Codex是否通过搜索有效地利用了有关库和其他资源的最新知识？

A6: 它目前主要利用加载到容器运行时的信息，包括GitHub仓库和其他在容器设置期间加载的文件。它并不直接访问最新的库文档或通过搜索获取实时信息。

不过，我们正在考虑如何让模型更好地利用最新知识。未来可能会结合检索增强生成（RAG）技术，通过动态引用外部知识库来解决信息落伍的问题。

Q7: OpenAI是否有类似《Absolute Zero: Reinforced Self-play Reasoning with Zero Data》论文中提到的研究方法，

比如让编码LLM通过“自我博弈”和强化学习（RL）来提高编码水平？

A7: 在Codex项目中，我们使用了强化学习来提升模型的编码能力、代码风格以及报告工作的准确性。

作为强化学习领域的研究者，我们对这类研究方向感到兴奋，并且认为强化学习在LLM和编码领域的应用前景广阔。

Q8: 如果量化Codex提升的编程效率，现在的整体开发效率提升了多少？

A8: 目前还处于早期阶段，但内部数据显示，如果项目从一开始就充分利用Codex智能体，代码和功能交付量可以提升约3倍。

相比以往，良好的软件工程实践越来越重要，包括清晰的代码模块划分、对关键功能的充分测试、高效的测试流程，以及便于快速审核的代码结构。

当这些因素与Codex的自动化能力相结合，就能大幅提升开发效率。

OpenAI：GPT-5就是All in One，集成各种产品

Q9: Codex团队认为10年后软件工程将会是什么样子？

A9: 我们期望能够高效且可靠地将软件需求转化为可运行的软件版本。

Q10: 如何确保Codex用来增强人类开发人员的能力而不是取代他们，特别是那些依靠边做边学的初级开发人员和自学成才的程序员？

A10：通过提供类似优秀老师的角色，降低新手入门的难度，帮助新一代程序员更快地学习。

当前的模型（如Codex）还远不能取代拥有更长记忆和更广泛背景知识的人类。如果模型能够承担部分工作，人类将有更多机会专注于他们真正擅长的事情。

最后，团队表示将面向Plus/Pro用户推出免费API积分，以供用户使用Codex CLI。

更多回答可移步𝕏知名博主光头哥的主页，里面主要涉及Codex的功能细节讲解。

OpenAI：GPT-5就是All in One，集成各种产品

One More Thing

与此同时，OpenAI官方还发布了一份“Codex上手指南”。

里面主要包含了以下内容：

Codex基础介绍如何连接你的GitHub？怎样向Codex提交任务以及运行？有哪些提示词技巧？

OpenAI：GPT-5就是All in One，集成各种产品

感兴趣的旁友，可戳下方链接～

Codex上手指南：

https://platform.openai.com/docs/codex

参考链接：

[1]https://www.reddit.com/r/ChatGPT/comments/1ko3tp1/ama_with_openai_codex_team/

[2]https://x.com/AndrewCurran_/status/1923448161621696712

[3]https://x.com/btibor91/status/1923511453002145854

[4]https://x.com/OpenAIDevs/status/1923492740526112819

文章来自于微信公众号 “量子位”，作者：一水

OpenAI：GPT-5就是All in One，集成各种产品

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。

项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！

项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址：https://github.com/n8n-io/n8n

在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。

项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file

【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

知识库

【开源免费】FASTGPT是基于LLM的知识库开源项目，提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信，飞书的AI项目都基于该项目二次开发。

项目地址：https://github.com/labring/FastGPT

RAG

【开源免费】graphrag是微软推出的RAG项目，与传统的通过 RAG 方法使用向量相似性作为搜索技术不同，GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。

项目地址：https://github.com/microsoft/graphrag

【开源免费】Dify是最早一批实现RAG，Agent，模型管理等一站式AI开发的工具平台，并且项目方一直持续维护。其中在任务编排方面相对领先对手，可以帮助研发实现像字节扣子那样的功能。

项目地址：https://github.com/langgenius/dify

【开源免费】RAGFlow是和Dify类似的开源项目，该项目在大文件解析方面做的更出色，拓展编排方面相对弱一些。

项目地址：https://github.com/infiniflow/ragflow/tree/main

【开源免费】phidata是一个可以实现将数据转化成向量存储，并通过AI实现RAG功能的项目

项目地址：https://github.com/phidatahq/phidata

【开源免费】TaskingAI 是一个提供RAG，Agent，大模型管理等AI项目开发的工具平台，比LangChain更强大的中间件AI平台工具。

项目地址：https://github.com/TaskingAI/TaskingAI

prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法，编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词，进而高质量的帮助用户通过AI解决问题。

项目地址：https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用：https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

IOS下载

安卓下载

微信群