北京时间3月19日凌晨1点,英伟达(NVIDIA)年度GPU技术大会(GTC)隆重开幕,首席执行官黄仁勋登台发表了长达两小时的主题演讲,演讲内容颇为丰富,包括芯片架构、生成式AI、数据中心、自动驾驶、AI工厂,以及个人AI超级计算机和机器人等。

1、计算行业正处于1万亿美元的拐点阶段:AI计算需求正在迅速加速,主要受到推理型AI(Reasoning AI)和自主型AI(Agentic AI)崛起的推动。AI工作负载的规模和复杂性正在改变全球数据中心的投资格局。
2、NVIDIA Blackwell已全面投产,性能提升40倍:Blackwell 架构的性能是 Hopper 的 40 倍,大幅提升了AI模型的训练和推理能力,使AI应用更加高效且具备更强的扩展性。NVIDIA Blackwell AI工厂平台的下一代版本——Blackwell Ultra,将于今年下半年开始部署到系统中。
3、NVIDIA 将遵循 AI 基础设施的年度升级节奏:每年都会推出新的GPU、CPU以及加速计算的技术进步,包括即将到来的NVIDIA Vera Rubin架构,该架构旨在提升AI数据中心的性能和效率。
4、AI基础设施(包括硅光子技术和AI优化存储)将颠覆行业格局:先进的网络和存储解决方案将提高大规模数据中心的AI扩展能力、运行效率和能源消耗水平。
5、工业和机器人领域的“物理AI”是50万亿美元的巨大机会:AI驱动的机器人和自动化将彻底改变制造、物流、医疗等行业,而NVIDIA的Isaac和Cosmos平台将引领这一变革。
AI 迎来关键拐点
NVIDIA CUDA 生态系统
通用汽车与 NVIDIA 合作推进 AI 发展

黄仁勋指出,AI的发展离不开强大的基础设施。如今,AI正向机器人、自驾车、工厂和无线网络等领域快速拓展。他表示,自动驾驶是AI最早进入的行业之一,并补充道:“我们为几乎每一家自动驾驶公司提供技术支持,无论是在数据中心还是在车辆中。”
黄仁勋宣布,这一旅程的下一步是:美国最大的汽车制造商——通用汽车(GM),将采用NVIDIA的AI、仿真技术和加速计算能力来开发下一代车辆、工厂和机器人。此外,他还发布了 NVIDIA Halos——一个全面的安全系统,将NVIDIA的汽车硬件和软件安全解决方案与其在自动驾驶安全领域的前沿AI研究相结合,为自动驾驶提供更高水平的安全保障。
数据中心与推理

接着,黄仁勋谈到了数据中心。他介绍道,NVIDIA Blackwell 平台已全面投入生产,并展示了来自各行业合作伙伴的系统图像。他感叹道:“这难道不美吗?”
黄仁勋详细说明了 Blackwell 如何支持极限扩展。他表示:“我们这样做是为了应对一个极具挑战的问题,那就是——推理(Inference)。”黄仁勋解释道,推理是指生成 token,这对企业至关重要。用于生成这些 token 的 AI 工厂必须具备极致的效率和卓越的性能。而随着新一代推理模型能够处理和解决越来越复杂的问题,对 token 的需求将持续增长。
为了进一步加速大规模推理,黄仁勋发布了 NVIDIA Dynamo——一款用于在AI工厂中加速和扩展AI推理模型的开源软件。黄仁勋表示:“Dynamo 本质上是 AI 工厂的操作系统。”
NVIDIA Blackwell Ultra
接着,黄仁勋播放了一段视频,展示了 NVIDIA Omniverse Blueprint 如何帮助规划一个 1吉瓦的AI工厂,让工程师能够通过数字双胞胎设计、测试和优化新一代智能制造数据中心。然后,黄仁勋宣布了 NVIDIA Blackwell AI工厂平台 的下一代版本——NVIDIA Blackwell Ultra,该平台将在今年下半年投放市场。NVIDIA Blackwell Ultra提升了训练和测试推理的规模化能力——即在推理过程中使用更多计算资源以提高准确性,从而帮助全球的组织加速应用程序,如AI推理、代理型AI和物理AI等。
NVIDIA Vera Rubin
黄仁勋向天文学家 Vera Rubin 致敬,并概述了一条将在未来几年内持续推动数据中心性能提升的发展路线图。他介绍了下一代 NVIDIA Rubin Ultra GPU 和 NVIDIA Vera CPU 架构,这些架构充满了创新。黄仁勋表示:“除了底盘,基本上一切都焕然一新。”
基于 Rubin Ultra 构建的系统,包括 Vera Rubin NVL 144,将于明年下半年推出。2027年下半年,基于 Rubin Ultra 构建的系统也将发布。黄仁勋表示:“你可以看到,Rubin 将大幅降低成本。”
NVIDIA硅光子学

黄仁勋转而讨论了NVIDIA如何帮助客户扩展到更大规模的系统。关键在于将硅光子学(基于硅光而非电信号传输数据的网络技术)紧密集成到加速计算基础设施中。黄仁勋解释道,这将使AI工厂能够在不同站点之间连接数百万个 GPU,同时减少能耗和运营成本。NVIDIA Spectrum-X和NVIDIA Quantum-X硅光子学网络交换机将电子电路与光通信融合在一起。
黄仁勋表示:“这真的是疯狂的技术。”NVIDIA硅光子学交换将光学创新与比传统方法少 4 倍的激光器结合,实现了以下突破:3.5倍的能效提升、63倍更强的信号完整性、10倍更好的网络扩展性和 1.3倍更快的部署速度。
DGX Spark 和 DGX Station

为了使 AI 开发者、研究人员、数据科学家和学生能够在桌面上原型设计、微调和推理大型模型,NVIDIA 发布了由 NVIDIA Grace Blackwell 平台驱动的 DGX 个人AI超级计算机。黄仁勋将其形容为完美的圣诞礼物,宣布了DGX Spark(原名Project DIGITS)和DGX Station —— 一款全新高性能的 NVIDIA Grace Blackwell 桌面超级计算机,它搭载了NVIDIA Blackwell Ultra 平台,将 Grace Blackwell 架构的强大性能带到了桌面。用户可以在本地运行这些模型,或将它们部署到 NVIDIA DGX Cloud 或任何其他加速云或数据中心基础设施上。黄仁勋表示:“这是 AI 时代的计算机。”
Agentic AI
基于 Llama 模型,NVIDIA Llama Nemotron 推理系列提供按需的 AI 推理能力。NVIDIA 在训练后增强了这一新推理模型系列,以提升多步骤数学运算、编程、推理和复杂决策的能力。
Physical AI 和 Robotics
在一段视频中,黄仁勋宣布 NVIDIA Isaac GR00T N1 的发布,这是全球首个开放、完全可定制的基础模型,旨在为通用人形推理和技能提供支持。NVIDIA 还宣布推出全新的 NVIDIA Cosmos 世界基础模型,为物理 AI 开发提供了开放且完全可定制的推理模型,赋予开发者前所未有的世界生成控制权。
黄仁勋表示:“利用 Omniverse 来条件化 Cosmos,并通过 Cosmos 生成无限数量的环境,使我们能够创建有基础的数据,这些数据由我们控制,但同时又是系统性地无限的。”他还介绍了由Google DeepMind和Disney Research 共同开发的开源物理引擎Newton,用于机器人模拟。接着,黄仁勋与一只小巧的机器人“Blue”一同登台,机器人从地板上的舱口中冒出来,并开始发出“嘟嘟”声与黄仁勋互动。
让我们总结一下
黄仁勋总结发言时强调了几个关键主题。
首先,Blackwell已经全面投入生产,他报告称:“生产的速度惊人,客户需求也非常强劲。”他说:“这完全是有原因的,因为人工智能正处于一个转折点,我们在人工智能中所需的计算量大幅增加,尤其是在推理人工智能系统和智能体系统的训练过程中。”
其次,Blackwell NVL72搭配 Dynamo 提供了40倍于 NVIDIA Hopper 的人工智能工厂性能。他指出:“推理将成为下一个十年最重要的工作负载之一,因为我们正在扩展人工智能的应用。”
第三,NVIDIA有着“年度节奏”的路线图,这样全球就可以规划其人工智能基础设施。NVIDIA正在构建三种人工智能基础设施:一用于云计算,二用于企业,三用于机器人。