刚刚,Gemini 2.5 Pro升级,成编程模型新王

搜索
AI-TNT
正文
资源拓展
刚刚,Gemini 2.5 Pro升级,成编程模型新王
2025-05-07 09:22

你的默认编程模型是什么?或许可以换一换了。


刚刚,Google DeepMind 发布了 Gemini 2.5 Pro 的最新更新版本:Gemini 2.5 Pro (I/O edition)



刚刚,Gemini 2.5 Pro升级,成编程模型新王


其最大的进步是编程能力大幅提升,不仅在 LMArena 编程排行榜上名列第一,同时也在 WebDev Arena 排行榜上更是以显著优势超过了昔日霸主 Claude 3.7 Sonnet (20250219)!


刚刚,Gemini 2.5 Pro升级,成编程模型新王


刚刚,Gemini 2.5 Pro升级,成编程模型新王


不仅如此,现在用户只需使用一个提示词即可构建 Web 应用、游戏和模拟程序等,甚至用户仅需提供一张手绘草图 + 功能描述,就能得到一个带有自己设计的 UI 的功能完备的应用。


此外,下面的视频还展示了 Gemini 2.5 Pro (I/O edition) 的另一项能力,可以根据自然图像生成代码,而这些代码可以动态表示自然图像中内容。


刚刚,Gemini 2.5 Pro升级,成编程模型新王


自家模型更新,谷歌的多位大佬也纷纷出来站台。



刚刚,Gemini 2.5 Pro升级,成编程模型新王


诺贝尔奖得主、DeepMind CEO Demis Hassabis 表示 Gemini 2.5 Pro (I/O edition) 已经在 Gemini APP、Vertex AI 和 Google AI Studio 中开放,并且其尤其擅长构建交互式 Web 应用,下面的演示展示了该模型根据草图构建应用的能力。


刚刚,Gemini 2.5 Pro升级,成编程模型新王


可以看到,只需一张描述画板应用的简单草图加上一句简单的提示词,Gemini 2.5 Pro (I/O edition) 就创建出了一个功能完备的 Web 应用。


另外,谷歌母公司 Alphabet CEO、Google AI 负责人 Jeff Dean 也都各自发布了宣传推文。



刚刚,Gemini 2.5 Pro升级,成编程模型新王



刚刚,Gemini 2.5 Pro升级,成编程模型新王


谷歌博客表示,他们原计划在几周后的 Google I/O 大会上发布 Gemini 2.5 Pro Preview (I/O edition),「但由于大家对这一模型的热情高涨,我们希望尽快将其交付到大家手中,以便人们能够立即开始构建。」


「Gemini 2.5 Pro 的编程和多模态推理功能获得了广泛好评,此次更新正是基于此。除了专注于 UI 的开发之外,这些提升还扩展到了其他编程任务,例如代码转换、代码编辑和开发复杂的智能体工作流。」


这些增强能力让 Gemini 2.5 Pro 在 WebDev Arena 中的 Elo 分数大幅提升:比上一版本高出 147 分!WebDev Arena 排行榜衡量的是人类对模型构建美观且功能强大的 Web 应用能力的偏好。


此外,新版 Gemini 2.5 Pro 在原生多模态和长上下文方面依然强势;它在视频理解方面表现一流 —— 在 VideoMME 基准测试中获得了 84.8% 的分数。


以下视频展示了 Gemini 2.5 Pro 根据单条 YouTube 视频生成交互式学习应用的示例,同时还给出了新旧 Gemini 2.5 Pro 的对比。


刚刚,Gemini 2.5 Pro升级,成编程模型新王


网友实测,新版 Gemini 2.5 Pro 真的行


既然是编程模型新王,网友们的测试热情可以说被瞬间激发。随便检索一下互联网,我们就能找到大量网友们分享的测试案例。


刚刚,Gemini 2.5 Pro升级,成编程模型新王


比如网友 @thenomadevel 让 Gemini 2.5 Pro Preview (I/O edition) 用 p5.js 编写了一个直接可玩的记忆配对游戏。


刚刚,Gemini 2.5 Pro升级,成编程模型新王


https://x.com/thenomadevel/status/1919823630143213715


DeepMind 产品设计师 Tim Bettridge 则 Vibe Code(氛围编程)了好几个不同的游戏和应用,比如这个看起来相当不错的星球飞行游戏:


刚刚,Gemini 2.5 Pro升级,成编程模型新王


https://x.com/TimBettridge/status/1919847724645789721


又比如这个功能完备的书架应用:


刚刚,Gemini 2.5 Pro升级,成编程模型新王




还有一个支持 3D 浏览的虚拟版芝加哥艺术博物馆。


刚刚,Gemini 2.5 Pro升级,成编程模型新王


更有网友用不到 20 分钟的时间构建了一个完整的城市交通模拟器。


刚刚,Gemini 2.5 Pro升级,成编程模型新王


https://x.com/WesRothMoney/status/1919887823257108941


机器之心也做了简单的尝试,将我们手绘的一张动物图片变成了一个简单的电子宠物游戏:


刚刚,Gemini 2.5 Pro升级,成编程模型新王


看起来,Vibe Coder 们又有新选择了。


参考链接

https://blog.google/products/gemini/gemini-2-5-pro-updates/



文章来自微信公众号 “ 机器之心 ”


刚刚,Gemini 2.5 Pro升级,成编程模型新王


1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费)


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/(付费)

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0

IOS下载
安卓下载
微信群
沪ICP备2023015588号