北京时间3月19日凌晨1点,英伟达(NVIDIA)年度GPU技术大会(GTC)隆重开幕,首席执行官黄仁勋登台发表了长达两小时的主题演讲,演讲内容颇为丰富,包括芯片架构、生成式AI、数据中心、自动驾驶、AI工厂,以及个人AI超级计算机和机器人等。



以下内容来源于英伟达官方博客
文章标题:《GTC 2025 – Announcements and Live Updates》
原文链接:https://blogs.nvidia.com/blog/nvidia-keynote-at-gtc-2025-ai-news-live-updates/#keynote
编译:超算百科


以下是NVIDIA(英伟达)创始人兼首席执行官黄仁勋在主题演讲中提到的核心要点:

1、计算行业正处于1万亿美元的拐点阶段:AI计算需求正在迅速加速,主要受到推理型AI(Reasoning AI)和自主型AI(Agentic AI)崛起的推动。AI工作负载的规模和复杂性正在改变全球数据中心的投资格局。
2、NVIDIA Blackwell已全面投产,性能提升40倍:Blackwell 架构的性能是 Hopper 的 40 倍,大幅提升了AI模型的训练和推理能力,使AI应用更加高效且具备更强的扩展性。NVIDIA Blackwell AI工厂平台的下一代版本——Blackwell Ultra,将于今年下半年开始部署到系统中。
3、NVIDIA 将遵循 AI 基础设施的年度升级节奏:每年都会推出新的GPU、CPU以及加速计算的技术进步,包括即将到来的NVIDIA Vera Rubin架构,该架构旨在提升AI数据中心的性能和效率。
4、AI基础设施(包括硅光子技术和AI优化存储)将颠覆行业格局:先进的网络和存储解决方案将提高大规模数据中心的AI扩展能力、运行效率和能源消耗水平。
5、工业和机器人领域的“物理AI”是50万亿美元的巨大机会:AI驱动的机器人和自动化将彻底改变制造、物流、医疗等行业,而NVIDIA的Isaac和Cosmos平台将引领这一变革。

AI 迎来关键拐点


黄仁勋概述了AI“逐步推理”的发展历程,并讨论了推理和强化学习需求如何推动AI计算需求的增长。随着AI进入关键拐点,全球四大云服务提供商对GPU的需求正在激增。黄仁勋表示,他预计数据中心建设的总价值将达到 1 万亿美元。

NVIDIA CUDA 生态系统


黄仁勋介绍道,NVIDIA CUDA-X GPU加速库和微服务如今已广泛应用于各个行业。他表示,未来每家公司都将拥有两个工厂:一个用于生产实体产品,另一个用于AI赋能在介绍NVIDIA在各个领域的应用时,黄仁勋宣布,NVIDIA将开源其 cuOpt 决策优化平台。他还指出,CUDA的安装基础如今已经“无处不在”。他说道:“我们已经达到了加速计算的拐点——CUDA让这一切成为可能。”

通用汽车与 NVIDIA 合作推进 AI 发展



黄仁勋指出,AI的发展离不开强大的基础设施。如今,AI正向机器人、自驾车、工厂和无线网络等领域快速拓展。他表示,自动驾驶是AI最早进入的行业之一,并补充道:“我们为几乎每一家自动驾驶公司提供技术支持,无论是在数据中心还是在车辆中。”

黄仁勋宣布,这一旅程的下一步是:美国最大的汽车制造商——通用汽车(GM),将采用NVIDIA的AI、仿真技术和加速计算能力来开发下一代车辆、工厂和机器人。此外,他还发布了 NVIDIA Halos——一个全面的安全系统,将NVIDIA的汽车硬件和软件安全解决方案与其在自动驾驶安全领域的前沿AI研究相结合,为自动驾驶提供更高水平的安全保障。

数据中心与推理


接着,黄仁勋谈到了数据中心。他介绍道,NVIDIA Blackwell 平台已全面投入生产,并展示了来自各行业合作伙伴的系统图像。他感叹道:“这难道不美吗?”


黄仁勋详细说明了 Blackwell 如何支持极限扩展。他表示:“我们这样做是为了应对一个极具挑战的问题,那就是——推理(Inference)。”黄仁勋解释道,推理是指生成 token,这对企业至关重要。用于生成这些 token 的 AI 工厂必须具备极致的效率和卓越的性能。而随着新一代推理模型能够处理和解决越来越复杂的问题,对 token 的需求将持续增长。


为了进一步加速大规模推理,黄仁勋发布了 NVIDIA Dynamo——一款用于在AI工厂中加速和扩展AI推理模型的开源软件。黄仁勋表示:“Dynamo 本质上是 AI 工厂的操作系统。”


NVIDIA Blackwell Ultra



黄仁勋介绍了 Blackwell 如何在推理性能上实现“飞跃”。他表示:“你要确保你拥有尽可能节能的架构。” 并展示了 Blackwell 相较于上一代如何在使用更少能量的情况下完成更多工作。黄仁勋幽默地补充道:“你买得越多,节省得越多。” 这引发了观众的笑声。“其实更好的是——你买得越多,赚得越多。”

接着,黄仁勋播放了一段视频,展示了 NVIDIA Omniverse Blueprint 如何帮助规划一个 1吉瓦的AI工厂,让工程师能够通过数字双胞胎设计、测试和优化新一代智能制造数据中心。然后,黄仁勋宣布了 NVIDIA Blackwell AI工厂平台 的下一代版本——NVIDIA Blackwell Ultra,该平台将在今年下半年投放市场。NVIDIA Blackwell Ultra提升了训练和测试推理的规模化能力——即在推理过程中使用更多计算资源以提高准确性,从而帮助全球的组织加速应用程序,如AI推理、代理型AI和物理AI等。

NVIDIA Vera Rubin



黄仁勋向天文学家 Vera Rubin 致敬,并概述了一条将在未来几年内持续推动数据中心性能提升的发展路线图。他介绍了下一代 NVIDIA Rubin Ultra GPUNVIDIA Vera CPU 架构,这些架构充满了创新。黄仁勋表示:“除了底盘,基本上一切都焕然一新。”

基于 Rubin Ultra 构建的系统,包括 Vera Rubin NVL 144,将于明年下半年推出。2027年下半年,基于 Rubin Ultra 构建的系统也将发布。黄仁勋表示:“你可以看到,Rubin 将大幅降低成本。”

NVIDIA硅光子学


黄仁勋转而讨论了NVIDIA如何帮助客户扩展到更大规模的系统。关键在于将硅光子学(基于硅光而非电信号传输数据的网络技术)紧密集成到加速计算基础设施中黄仁勋解释道,这将使AI工厂能够在不同站点之间连接数百万个 GPU,同时减少能耗和运营成本。NVIDIA Spectrum-X和NVIDIA Quantum-X硅光子学网络交换机将电子电路与光通信融合在一起。


黄仁勋表示:“这真的是疯狂的技术。”NVIDIA硅光子学交换将光学创新与比传统方法少 4 倍的激光器结合,实现了以下突破:3.5倍的能效提升、63倍更强的信号完整性、10倍更好的网络扩展性和 1.3倍更快的部署速度。


DGX Spark 和 DGX Station


为了使 AI 开发者、研究人员、数据科学家和学生能够在桌面上原型设计、微调和推理大型模型,NVIDIA 发布了由 NVIDIA Grace Blackwell 平台驱动的 DGX 个人AI超级计算机。黄仁勋将其形容为完美的圣诞礼物,宣布了DGX Spark(原名Project DIGITS)和DGX Station —— 一款全新高性能的 NVIDIA Grace Blackwell 桌面超级计算机,它搭载了NVIDIA Blackwell Ultra 平台,将 Grace Blackwell 架构的强大性能带到了桌面。用户可以在本地运行这些模型,或将它们部署到 NVIDIA DGX Cloud 或任何其他加速云或数据中心基础设施上。黄仁勋表示:“这是 AI 时代的计算机。”

Agentic AI


AI已经经历了三代技术范式的转移。最早是判别式AI(语音识别、图像识别),接着是生成式AI,然后是当下身处的Agentic AI,未来会是影响物理世界的Physical AI。在转向讨论 Agentic AI 的未来时,黄仁勋宣布了 开放式 Llama Nemotron 系列模型,这些模型具备推理能力,旨在为开发者和企业提供一个商业就绪的基础,帮助他们创建能够独立工作或作为连接团队共同解决复杂任务的高级 AI 代理。

基于 Llama 模型,NVIDIA Llama Nemotron 推理系列提供按需的 AI 推理能力。NVIDIA 在训练后增强了这一新推理模型系列,以提升多步骤数学运算、编程、推理和复杂决策的能力。

Physical AI 和 Robotics



黄仁勋将机器人描述为下一个 10万亿美元的行业,他表示,到本十年末,全球将至少缺少 5000万 名工人。NVIDIA 提供了一整套技术,用于训练、部署、模拟和测试下一代机器人技术。

在一段视频中,黄仁勋宣布 NVIDIA Isaac GR00T N1 的发布,这是全球首个开放、完全可定制的基础模型,旨在为通用人形推理和技能提供支持。NVIDIA 还宣布推出全新的 NVIDIA Cosmos 世界基础模型,为物理 AI 开发提供了开放且完全可定制的推理模型,赋予开发者前所未有的世界生成控制权。

黄仁勋表示:“利用 Omniverse 来条件化 Cosmos,并通过 Cosmos 生成无限数量的环境,使我们能够创建有基础的数据,这些数据由我们控制,但同时又是系统性地无限的。”他还介绍了由Google DeepMind和Disney Research 共同开发的开源物理引擎Newton,用于机器人模拟。接着,黄仁勋与一只小巧的机器人“Blue”一同登台,机器人从地板上的舱口中冒出来,并开始发出“嘟嘟”声与黄仁勋互动。

让我们总结一下

黄仁勋总结发言时强调了几个关键主题。

首先,Blackwell已经全面投入生产,他报告称:“生产的速度惊人,客户需求也非常强劲。”他说:“这完全是有原因的,因为人工智能正处于一个转折点,我们在人工智能中所需的计算量大幅增加,尤其是在推理人工智能系统和智能体系统的训练过程中。”

其次,Blackwell NVL72搭配 Dynamo 提供了40倍于 NVIDIA Hopper 的人工智能工厂性能。他指出:“推理将成为下一个十年最重要的工作负载之一,因为我们正在扩展人工智能的应用。”

第三,NVIDIA有着“年度节奏”的路线图,这样全球就可以规划其人工智能基础设施。NVIDIA正在构建三种人工智能基础设施:一用于云计算,二用于企业,三用于机器人。


【一文了解】英伟达 2025GTC都发布了啥:正在构建三种AI基础设施,用于云计算、AI和机器人

点赞(0)

微信公众账号

微信扫一扫加关注

返回
顶部