OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了

搜索
AI-TNT
正文
资源拓展
OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了
2025-01-22 11:27

没错,OpenAI的智能体时代真的要来了!


据大名鼎鼎的“情报员”光头哥爆料,OpenAI在MAC版ChatGPT桌面应用中隐藏了启用/禁用智能体的选项


从截图来看,确实是传闻已久、代号为“Operator(操作员)”的辣个:


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


而且这则爆料也得到了日常关注苹果方面消息的博主@M1的再次佐证:


Operator正在内测中,即将上线MAC版ChatGPT桌面应用……


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


根据介绍,Operator能够接管用户PC,直接代替人类自主执行一系列操作(如编码开发应用、订餐,做攻略等等)。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


与此同时,OpenAI智能体和其他竞争对手(如Anthropic、谷歌智能体),以及人类选手的跑分对比也曝光了。


先划个重点,在几个评估智能体执行自动化任务水平的基准测试中,OpenAI这边均战胜了Claude智能体。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


网友们纷纷激动表示,看起来离发布已经很近了,或许又会是下一个ChatGPT时刻。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


而Windows用户则开启了刷屏模式,请不要仅限于Mac、请不要仅限于Mac、请不要仅限于Mac……(OpenAI你听到了吗)


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


多个基准跑分超过Claude智能体


从光头哥的另一条推文里,我们看到了OpenAI智能体和其他竞品的详细对比。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


相关数据来自OpenAI网站,具体为图中标黄部分。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


单拉出来看,在OSWorld这个专为多模态Agent设置的基准测试中,OpenAI CUA(据推测可能是驱动Operator的AI模型)得分为38.1%,领先于Anthropic的Computer use功能,但还不及人类自己操作的一半水平。


类似情况也在WebArena(CMU发布的基于Web环境的基准测试)上演。


不过,在WebVoyager(由腾讯AI Lab发布的多模态网络Agent基准测试)则稍有反转,OpenAI CUA取得了87%的好成绩,不仅一如既往地领先Anthropic,还以小幅优势超过了人类(85.3%)。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


从一些具体任务的完成通过率来看,有辅助的Operator表现好过完全自主操作,不过偶尔还是比不上带视觉能力的GPT-4o。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


有网友据此提问Operator是否不如GPT-4o,对此另有热心网友指出了二者区别:


一个是自主操作,一个是教你做事。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


另外,对二者安全性的评估如下,GPT-4o在拒绝非法宣传、极端活动讨论等方面均为100%,而Operator在越狱(Jailbreaks)、进行非法活动以及禁止的金融活动方面没有达到100%。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


需要提醒的是,在光头哥看来,以上跑分也可能只是占位符,具体真实性无法保证。(先来个免责声明)


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


2025:OpenAI重点布局Agent


事实上,Operator这款智能体早在去年11月就有相关爆料。


当时彭博社声称,OpenAI将在明年1月推出它,来替用户自动执行任务。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


而现在,也算是进一步佐证了之前的消息。


甚至就在去年底,OpenAI CEO奥特曼也在新年目标中,明晃晃地将Agent排在前列。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


而Flag立完后,OpenAI刚一开年也是马不停蹄地开始了相关动作。


上周,OpenAI就为ChatGPT推出了新功能「Tasks」,让AI有了执行力,可以替你完成各种任务。


无论是一次性提醒还是重复执行的动作,告诉ChatGPT你需要什么以及何时需要,它会自动帮你处理。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


整体看起来有点偏向日程提醒,更像Agent的初级阶段。


合理推测,Operator将在此基础上有更多、更强的能力表现。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


话说,从国内外科技企业对Agent的新追逐来看,今年Agent绝对有好戏看!


据市场研究公司Markets and Markets的分析,AI Agent的市场规模至2030年有望达到471亿美元


如此吸引下,再加上已经成熟的大模型技术,Agent火爆2025简直不言而喻。


甚至就在今年的CES上,英伟达CEO黄仁勋也对Agent大加赞赏:


未来公司IT部门将成为Agent人力资源部门……(为公司改进大量Agents,从而为各部门提供新支持)


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


此番言论下,了解AI Agent技术也被开发者们提上了2025学习日程。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了


好嘛,不管是企业还是个人,接下来大家都得卷Agent了(doge)。


参考链接:

[1]https://techcrunch.com/2025/01/20/openais-agent-tool-may-be-nearing-release/?guccounter=1

[2]https://x.com/minchoi/status/1876644835286777922


文章来自于“量子位”,作者“一水”。


OpenAI智能体新线索曝光!网友:新ChatGPT时刻要来了

1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

2
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

IOS下载
安卓下载
微信群
沪ICP备2023015588号