GPT-5将会集大成于一体?!
就在发布“最强编程智能体Codex”之后,OpenAI又接着在Reddit举行了“有问必答”活动。
公司研究副总裁Jerry Tworek,剧透了下一代基础模型GPT-5的最新消息:
为了减少模型切换,未来计划将Codex、Operator、Deep Research和Memory整合在一起。
除此之外,其他Codex团队成员也纷纷开启了爆料模式,比如:
Okk,下面我们一起吃瓜。
整体而言,OpenAI团队这次主要分享了Codex的详细情况,以及公司未来的发展计划。
为了尽量贴合问答者原意,我们直接以对话形式展开。
Q1: 为什么要用TypeScript编写Codex CLI工具,而不是Python?
A1: 因为开发者对TypeScript比较熟悉,而且它适合用于UI(包括终端界面)。
不过,未来会有一个高性能引擎,支持多种语言的绑定,开发者可以使用自己熟悉的语言进行扩展。
Q2: 为什么选择在云上运行代码,而不是在本地运行Agent(比如使用MCP)?
A2: 虽然Codex CLI可以在本地运行Agent,但受限于计算机性能,通常是单线程的。
而在云端运行可以实现并行化和沙盒化,这样可以让模型在无人监督的情况下安全地运行代码。
Q3: 团队在使用Codex时,发现了哪些与目前的“氛围编码(vibe coding)”不同的范式转变?开发这个工具的灵感是什么?
A3: 主要区别是可以同时生成大量代码版本,然后从中选择代码质量最好的版本。这就好比你可以培养一大批喜欢编程的小程序员,然后从中挑选出最佳代码版本。
事实上,Codex工具最初是一些工程师的业余项目,他们对在OpenAI的日常工作中没有充分利用模型感到沮丧,因此才想到要开发它。
Q4: GPT-5是否有可能不仅仅帮助编写代码,还能在计算机上完成更多任务?换句话说,它是否会成为一个真正的助手,而不仅仅是提供建议?
A4: GPT-5是我们的下一代基础模型,核心目标是提升现有模型的能力,减少模型切换。
目前已经有一个可以在计算机上执行任务的产品——Operator。虽然它目前仍处于研究预览阶段,但未来会进行改进,成为一个非常有用的工具。
未来计划是将现有的工具(如Codex、Operator、Deep Research、Memory)整合在一起,使它们感觉像一个整体。
Q5: Codex只适合高级工程师吗?
A5: 可能对那些想解决繁琐问题而非超级难题的人来说更合适。
Q6: Codex是否通过搜索有效地利用了有关库和其他资源的最新知识?
A6: 它目前主要利用加载到容器运行时的信息,包括GitHub仓库和其他在容器设置期间加载的文件。它并不直接访问最新的库文档或通过搜索获取实时信息。
不过,我们正在考虑如何让模型更好地利用最新知识。未来可能会结合检索增强生成(RAG)技术,通过动态引用外部知识库来解决信息落伍的问题。
Q7: OpenAI是否有类似《Absolute Zero: Reinforced Self-play Reasoning with Zero Data》论文中提到的研究方法,
比如让编码LLM通过“自我博弈”和强化学习(RL)来提高编码水平?
A7: 在Codex项目中,我们使用了强化学习来提升模型的编码能力、代码风格以及报告工作的准确性。
作为强化学习领域的研究者,我们对这类研究方向感到兴奋,并且认为强化学习在LLM和编码领域的应用前景广阔。
Q8: 如果量化Codex提升的编程效率,现在的整体开发效率提升了多少?
A8: 目前还处于早期阶段,但内部数据显示,如果项目从一开始就充分利用Codex智能体,代码和功能交付量可以提升约3倍。
相比以往,良好的软件工程实践越来越重要,包括清晰的代码模块划分、对关键功能的充分测试、高效的测试流程,以及便于快速审核的代码结构。
当这些因素与Codex的自动化能力相结合,就能大幅提升开发效率。
Q9: Codex团队认为10年后软件工程将会是什么样子?
A9: 我们期望能够高效且可靠地将软件需求转化为可运行的软件版本。
Q10: 如何确保Codex用来增强人类开发人员的能力而不是取代他们,特别是那些依靠边做边学的初级开发人员和自学成才的程序员?
A10:通过提供类似优秀老师的角色,降低新手入门的难度,帮助新一代程序员更快地学习。
当前的模型(如Codex)还远不能取代拥有更长记忆和更广泛背景知识的人类。如果模型能够承担部分工作,人类将有更多机会专注于他们真正擅长的事情。
最后,团队表示将面向Plus/Pro用户推出免费API积分,以供用户使用Codex CLI。
更多回答可移步𝕏知名博主光头哥的主页,里面主要涉及Codex的功能细节讲解。
与此同时,OpenAI官方还发布了一份“Codex上手指南”。
里面主要包含了以下内容:
感兴趣的旁友,可戳下方链接~
Codex上手指南:
https://platform.openai.com/docs/codex
参考链接:
[1]https://www.reddit.com/r/ChatGPT/comments/1ko3tp1/ama_with_openai_codex_team/
[2]https://x.com/AndrewCurran_/status/1923448161621696712
[3]https://x.com/btibor91/status/1923511453002145854
[4]https://x.com/OpenAIDevs/status/1923492740526112819
文章来自于微信公众号 “量子位”,作者 :一水
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址:https://github.com/n8n-io/n8n
在线使用:https://n8n.io/(付费)
【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。
项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file
【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用:https://vectorvein.ai/(付费)
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md
【开源免费】FASTGPT是基于LLM的知识库开源项目,提供开箱即用的数据处理、模型调用等能力。整体功能和“Dify”“RAGFlow”项目类似。很多接入微信,飞书的AI项目都基于该项目二次开发。
项目地址:https://github.com/labring/FastGPT
【开源免费】graphrag是微软推出的RAG项目,与传统的通过 RAG 方法使用向量相似性作为搜索技术不同,GraphRAG是使用知识图谱在推理复杂信息时大幅提高问答性能。
项目地址:https://github.com/microsoft/graphrag
【开源免费】Dify是最早一批实现RAG,Agent,模型管理等一站式AI开发的工具平台,并且项目方一直持续维护。其中在任务编排方面相对领先对手,可以帮助研发实现像字节扣子那样的功能。
项目地址:https://github.com/langgenius/dify
【开源免费】RAGFlow是和Dify类似的开源项目,该项目在大文件解析方面做的更出色,拓展编排方面相对弱一些。
项目地址:https://github.com/infiniflow/ragflow/tree/main
【开源免费】phidata是一个可以实现将数据转化成向量存储,并通过AI实现RAG功能的项目
项目地址:https://github.com/phidatahq/phidata
【开源免费】TaskingAI 是一个提供RAG,Agent,大模型管理等AI项目开发的工具平台,比LangChain更强大的中间件AI平台工具。
项目地址:https://github.com/TaskingAI/TaskingAI
【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。
项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md
在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0