英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

AI资讯 2025-05-19 17:31

+8597 阅读

英伟达官宣新办公室落户中国台湾省台北市，但居然是从太空飞下来的吗？

当然，这只是黄仁勋在Computex大会上展示的CG特效，但背后还有这样一层意思：

如此逼真的画面中，只有1/10的像素是显卡渲染的，剩下全部内容为AI预测。

当初是GeForce显卡让AI成为现实，现在AI反过来给GeForce显卡带来颠覆性变革。

除了正式宣布新办公室地址，会上英伟达还宣布多款重磅新品：

面向个人有DGX Station，在桌面跑1T参数大模型，这回刀法也不用了，足足给到800GB内存。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

面向企业有RTX PRO Server，可加速从AI智能体、物理AI、科学计算到渲染、3D图形和视频等各种用例。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

同时老黄还表示英伟达正在经历一次转型，从一家芯片公司扩展到一家AI基础设施公司。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

过去几十年，英伟达从造GPU芯片到造超算系统，现在造数据中心都已经不满足了，接下来要交付的是“星际之门”、xAI Colossus超级计算集群这样的大项目。

老黄表示，AI基础设施市场将以数万亿美元衡量。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

此外，这场演讲中的其他亮点还有：

发布半定制化NVLink Fusion（混搭，有IP就可用）
推出英伟达AI数据平台
宣布与迪士尼合作机器人项目

……

下面一起来看。

“买的越多，创造的越多”

今年第三季度，英伟达主打产品将升级到Blackwell架构GB300超级芯片。

与GB200相比，GB300在算力和内存上约提升50%，网络连接性能则提升1倍。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

2个超级新品组成1个计算节点(node)，老黄在现场还拆开实物，详细展示了其内部构造。

2018年的Sierra超级计算机中包含18000块英伟达Volten架构GPU，如今一个Blackwell计算节点就可提供同等的算力。

按黄式数学，这叫6年时间性能提升约4000倍。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

将这些节点连接在一起就需要NVLink，这次老黄重点了系统的“脊柱”NVLink Spine，内含总长两英里（3.218公里）的5000条铜缆，将每块芯片之间全互联，实现每秒14.4TB的全连接带宽。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

这次宣布的新品则是NVLink Fusion，允许合作伙伴将NVLink技术应用于定制的机架。

也就是说，非英伟达的CPU和其他加速器也可以与英伟达产品结合使用，同时享有NVLink的高速连接。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

数据中心产品之外，英伟达在桌面产品上再次发力。

老黄先透露，之前宣布的个人AI计算机DGX Spark已全面投产，将于数周内上市。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

DGX Spark采用英伟达GB10芯片，能够提供每秒1000万亿次的AI运算，用于微调和推理最新AI模型。

升级款DGX Station，则首次搭载了与数据中心同款的GB300超级芯片。

英伟达表示DGX Station属于全新设计的计算机类别，适用于在桌面上开发和运行大规模AI训练和推理工作负载。

高达784GB的大容量统一内存，最高支持运行1T参数的大模型，也就是说671B的满血DeepSeek R1能跑一个半。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

面向企业的RTX Pro Server搭载了8块RTX PRO 6000服务器版GPU，96GB GDDR7内存，1.6TB/s内存带宽。

一台RTX Pro Server机架包括4台RTX PRO Server服务器，提供120PFlops的FP4峰值算力。

现场也特意用了DeepSeek R1模型的测试数据，每花费500万美元，RTX PRO Server的性价比是H100的四倍。

花更少的钱，生成更多的token。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

对于这一系列新品，老黄这次改变了促销口号。

从“买的越多，省得越多”，变成了“买的越多，创造的越多”。

GPU之外一系列新发布

老黄表示，人类要查询像SQL这样的结构化数据，而AI想要查询的是非结构化数据，因此需要打造新型存储平台，也就是NVIDIA AI数据平台。

这个新型的存储平台不再是依靠CPU，而是配备计算GPU。

并且打造了一个新型查询系统——Nvidia AIQ或IQ，就像SQL服务器、SQL软件和文件存储软件一样，类似一个复杂的软件层。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

他还提到，加速运算始于CUDA-X，这个集合几乎包含了所有领域的加速运算。

比如，Aerial和Sionna能够将AI带到5G和6G；Monai可以用于医学成像；Earth-2用于天气预报；Coup quantum用于量子经典计算架构；以及Megatron、Dynamo、NIXL等包含了深度学习所有的训练库。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

英伟达正在研究一类量子经典或量子GPU计算平台——CUDAQ，与全球优秀企业合作，将AI带入5G和6G。

并且，老黄还提到未来的超级计算机就是具有QPU和GPU的QPU。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

物理AI，是机器人革命的基石。

老黄举了个例子，比如说滚动一个球，根据球的速度，它可能到了汽车底下或者汽车的另一边，但它没有消失；又比如面前有张桌子，最好的选择是绕过它或者钻过去，而不是直接穿过它。

在人工智能时代，AI能够推理类似的物理事件是极其重要的。

而如今要做的事情就是研究一种能够根据提示自主生成视频，然后进行训练的机器人。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

在此构想之下，英伟达/谷歌DeepMind/迪士尼合作开发了专为机器人开发而构建的新一代开源物理引擎Newton，可让机器人学习如何以更高的精度处理复杂任务。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

One More Thing

除了演讲现场火爆，在会场外的英伟达纪念品摊位这次也很受欢迎。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

亮点是其中的文化衫，印满了老黄的Q板头像。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

只能说，老黄现在是明星级待遇。

视频回放：

https://www.youtube.com/watch?v=TLzna9__DnI

参考链接：

[1]https://www.nvidia.com/en-us/products/workstations/dgx-station/

[2]https://nvidianews.nvidia.com/news/nvidia-rtx-pro-servers-speed-trillion-dollar-enterprise-it-industry-transition-to-ai-factories

[3]https://x.com/JSolomonCNBC/status/1924245721311809845

文章来自于“量子位”，作者“梦晨闻乐”。

英伟达新“桌面超算”800GB大内存，满血DeepSeek R1能装1个半

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。

项目地址：https://github.com/browser-use/browser-use

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。

项目地址：https://github.com/Significant-Gravitas/AutoGPT

【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。

项目地址：https://github.com/InternLM/xtuner