황런쉰의 'Agent 공장'에는 어떤 새로운 이야기가 담겼을까?

星球君的朋友们

Odaily资深作者

2026-06-01 12:00

이 기사는 약 6403자로, 전체를 읽는 데 약 10분이 소요됩니다

Agent가 AI 인프라가 될 때, 모든 계층에 엔비디아가 있을 수 있다.

AI 요약

펼치기

핵심 관점: 엔비디아는 COMPUTEX 2026에서 'Agent AI'를 중심으로 칩, 모델, 로봇 플랫폼에 이르는 완전한 기술 체계를 구축한다고 발표했다. Vera Rubin 플랫폼을 양산하고 Agent 작업에 특화해 최적화하여, AI 공장을 인프라 단계에서 운영 및 배포의 새로운 시대로 전환하는 것을 목표로 한다.
핵심 요소:
1. Vera Rubin 플랫폼은 Agent 전용으로 설계되어 양산되었으며, 처리 효율은 이전 세대 Grace Blackwell의 10배이고, 처음으로 대규모로 CPO 네트워크 기술 및 기밀 컴퓨팅을 도입했다.
2. 회사는 AI 시대에 특화된 Vera CPU를 발표했으며, Agent 작업 성능은 동급 x86 서버의 1.8배로 완전히 생산에 들어갔다.
3. DSX 공장 운영 시스템을 출시했으며, MaxLPS(전력 최적화)와 DSX OS(운영 관리)를 포함하여 AI 데이터 센터의 구축 및 운영을 표준화하는 것을 목표로 한다.
4. 5500억 개의 파라미터를 가진 혼합 전문가 모델 Nemotron 3 Ultra와 오픈소스 Agent 프레임워크 NemoClaw를 발표하여 기업 수준의 '디지털 동료'를 구축한다.
5. 세 번째 물리 AI 모델인 Cosmos 3를 발표하여 시각적 추론, 생성 및 동작 예측을 통합하고, 물리 AI 훈련 주기를 수개월에서 수일로 단축하는 것을 목표로 한다.
6. 위슈 트리와 공동으로 휴머노이드 로봇 레퍼런스 디자인 H2 Plus를 발표하고, 물리 AI '스킬' 툴킷을 오픈소스화하여 로봇 개발의 진입 장벽을 낮췄다.
7. Vera BlueField-4 STX가 스토리지 보안을 업그레이드하여 칩 수준의 정책 실행을 통해 Agent와 기업 데이터 간의 상호작용 안전을 보장한다.

原文作者：李海伦苏扬

原文编辑：徐青阳

原文来源：腾讯科技

2026年6月1日，在COMPUTEX 2026期间举办的NVIDIA GTC Taipei大会上，英伟达创始人兼CEO黄仁勋发表主题演讲。

距离上一场GTC，不过三个月。

当时，英伟达发布了Vera Rubin的“芯片全家桶”，包括：Vera CPU、Rubin GPU、Groq 3 LPU、ConnectX-9、BlueField-4 DPU、Spectrum-6交换机，六颗芯片构成一台机架级AI超算，并宣告训练大型MoE模型所需GPU数量降至四分之一，推理吞吐量每瓦提升10倍，单token成本降至十分之一。

和之前强调“芯片全家桶”、“算力全家桶”这种系统级解决方案不同，三个月后COMPUTEX，黄仁勋把目光投向这些基础设施将服务的目标——Agent。

黄仁勋在演讲中透露：Vera Rubin正式进入量产，Vera CPU开始向全球交付，DGX Station第一次以Windows形态走进企业桌面，Cosmos 3重构物理AI的感知框架，DSX成为AI工厂的运营操作系统。英伟达还联合宇树发布了H2 Plus——首款基于Isaac GR00T的人形机器人参考设计，把Agent的边界从数字世界延伸到物理形态。

英伟达正在围绕Agent生态，重新组织从芯片、数据中心、模型、软件到机器人平台的完整技术体系。

黄仁勋说：“Agent AI和实用型人工智能时代已经到来。现在token（也称‘词元’）是利润单位，AI是GDP‘生成器’，软件工程师的数量正在增加。人们谈论AI减少了工作岗位，这完全是胡说八道，实际上有更多的软件工程师正在被雇用”。

同样的AI工厂，跑出10倍Agent任务

Vera Rubin平台已全面投产。

与过去主要面向大模型训练和推理不同，Vera Rubin从设计之初就把Agent作为重点工作负载。

黄仁勋在演讲中表示，一个Agent任务往往不只是一次模型推理，而是包含推理、搜索、工具调用、代码执行和结果验证等多个环节，背后可能涉及数千个步骤。未来数据中心需要处理的，也不再只是单个模型请求，更多的是大量持续运行、相互协作的Agent任务。

该平台被定义为一个巨大的、统一的计算单元级AI超级计算机，专为处理从推理、检索到工具使用的智能体工作负载而构建。在同样规模的超大型数据中心里，用全新的 Vera Rubin 平台来运行自主 AI 智能体的任务，其处理效率是上一代 Grace Blackwell平台的10倍。

除了计算平台本身，网络也成为Vera Rubin升级的重点之一。

过去数据中心里，GPU之间的数据传输主要依赖传统光模块和交换机架构，但当集群规模持续扩大后，功耗、散热和部署复杂度都会快速上升。为此，英伟达在Vera Rubin平台中引入了Spectrum-X Ethernet Photonics网络系统。

这是英伟达首次将共封装光学（CPO）技术大规模引入AI数据中心网络。

简单来说，传统方案需要把光模块插在交换机外部，而CPO则直接把光学器件集成到交换机内部，从而减少能耗和信号损失。

此外，安全也是此次Vera Rubin平台重点强调的核心能力。

为此，英伟达将机密计算（Confidential Computing）能力扩展到整个Vera Rubin平台。通过可信执行环境、硬件级验证以及端到端加密机制，企业能够在处理私有数据、行业敏感信息和关键模型时获得更高等级的安全保障。

黄仁勋透露，Vera Rubin已经进入量产阶段。作为第三代MGX机架级系统，其背后涉及超过150家合作伙伴、350多座工厂以及覆盖30多个国家和地区的供应链体系。按照英伟达公布的计划，Vera Rubin将于今年秋季开始正式出货。

“为Agent而生”的处理器

英伟达推出了专为智能体时代设计的新型处理器Vera，并已全面投产。

黄仁勋指出，内存系统的进步将推动存储系统进行创新和现代化升级。至今为止的所有CPU都是为人类打造的，而Vera是为AI时代设计的CPU，为智能体打造。

作为Grace的继任者，Vera采用了英伟达自主设计的“Olympus” CPU核心架构，核心数量从72个提升至88个，并大幅提高内存和数据处理能力。据英伟达介绍，在Agent相关工作负载测试中，Vera的任务执行速度达到同期x86服务器CPU的1.8倍。

相比单纯的性能提升，更重要的变化在于Vera与Rubin GPU之间的关系：Vera通过第二代NVLink-C2C与Rubin GPU连接，互联带宽达到1.8TB/s，Agent运行过程中在CPU和GPU之间传递数据的开销进一步降低。

黄仁勋表示，Vera Rubin采用美光、SK海力士和三星的HBM（高带宽内存），供应链规模是上一代Blackwell的“两倍”。不过，部署一个大型Blackwell机架需要两个小时，而Vera Rubin的时间被压缩到5分钟级别。

让AI工厂从“建设”走向“运营”

NVIDIA这次推出的DSX，可以理解为一套“AI工厂建设和运营工具箱”。

过去建设AI数据中心，客户需要分别考虑服务器、网络、电力、冷却、机房设计和运维系统，很多环节依赖不同供应商协同。DSX要做的，是把这些原本分散的环节放到同一个框架里，让客户从设计、仿真、建设到运营，都有一套可参考、可验证的标准方案。

黄仁勋在发布会现场表示：NVIDIA不只是卖芯片，而是要给基础设施建设者一套完整的AI工厂蓝图。

这次DSX最重要的新增能力主要有两个。

第一个是DSX MaxLPS。它解决的是AI工厂最现实的问题：在电力预算固定的情况下，如何放下更多GPU、跑出更多Token。

按照英伟达的说法，MaxLPS结合液冷和机架内功耗优化，可以让运营商在不明显影响性能的情况下，多运行最多40%的GPU。

第二个是DSX OS。它相当于AI工厂的运营软件，负责生命周期管理、智能调度、健康监测、故障恢复、多租户管理等工作。简单来说，如果AI工厂是一座复杂工厂，DSX OS负责让这座工厂持续稳定运转。

在DSX的产品矩阵当中，Reference Design提供AI工厂参考设计，告诉客户机房、机架、网络、电力和冷却系统应该如何搭建；DSX Sim负责仿真，让客户在建设前先验证设计是否可行；DSX Flex把AI工厂和电网连接起来，让数据中心可以根据电价、负荷和需求响应信号调整任务；DSX Exchange则负责打通IT系统、运营系统、能源和冷却系统之间的数据接口。

在生态系统方面，CoreWeave、Crusoe、Lambda等云合作伙伴正部署DSX Sim、MaxLPS和DSX OS以降低风险并提高GPU利用率。戴尔、HPE、联想、Supermicro以及华硕、富士康、技嘉、云达科技等制造商正构建支持DSX的系统。

与Windows和ARM抱团

现场演讲中，黄仁勋官宣“DGX Station for Windows”工作站登台亮相，被英伟达定义为面向Windows生态的桌面级AI超级计算机。

硬件上，它搭载GB300 Grace Blackwell Ultra Desktop Superchip，通过NVLink-C2C连接Blackwell Ultra GPU与72核Grace CPU，最高提供748GB统一内存和20 PFLOPS FP4性能，并配备最高800Gb/s网络能力。

这款产品的重点在于Agent部署方式的变化。

英伟达希望企业能够在本地、安全、可管理的Windows环境中运行多个Agent，并将其接入设计、工程、数据科学、推理和Physical AI等工作流。同步推出的OpenShell负责Agent运行安全，通过隔离沙箱和系统级策略控制，限制Agent越权操作或泄露凭证、私有数据。

除了面向企业桌面的产品，黄仁勋还在会上发了一颗系统级SoC——RTX Spark SoC，把N1X CPU和Blackwell GPU做进了一块芯片上，统一内存架构，专门给轻薄笔记本和小型台式机用。

其中，N1X是英伟达与微软共同打造的首款PC处理器，它基于Arm架构，由联发科定制设计，台积电3纳米工艺制造。今秋首发搭载于微软、戴尔、惠普、华硕、联想和微星的笔记本，首批超过30款机型，主打高端轻薄本。

这是英伟达为AI PC时代准备的“超级芯”，黄仁勋把它视为PC形态的一次重要重构。

Agent的“两个大脑”

这次发布会上，英伟达公布了两条核心模型产品线的最新进展，分别对应Agent的两个场景：一个跑在企业系统里，一个跑在物理世界中。

英伟达发布了一款拥有5500亿参数的混合专家模型Nemotron 3 Ultra，可为代码开发、科研及企业业务流程中的长效智能体提供顶尖智能能力。相较于同级别主流开源前沿模型，该模型推理速度最高提升5倍，使用成本最高降低30%，助力智能体更高效、低成本地完成各项任务。

围绕Nemotron开放模型，英伟达发布了一系列软件、开源模型和合作进展，目标是让企业在工程设计、医疗健康、软件开发和业务运营等场景中，构建能够协助员工工作的“数字同事”。

这套组合里，Nemotron提供基础模型能力，NemoClaw负责把模型组织成Agent，OpenShell负责运行时安全，Agent Toolkit则把CUDA-X等英伟达软件库变成Agent可以直接调用的工具。Agent可以在受控环境中使用工具、调用数据、执行任务，并接入企业现有系统。

黄仁勋表示，全球软件公司正在把AI Agent带入真实工作系统，让它们帮助员工更快完成复杂任务。NemoClaw提供了构建长期运行Agent所需的开放组件，包括编排、上下文、记忆、工具调用和安全控制等能力。

过去企业讨论AI，更多关注模型能回答什么；现在英伟达要解决的是，Agent如何安全地接入工具、数据和业务流程，并在真实工作中持续运行。

还有Cosmos 3，作为Cosmos系列的第三代正式发布，也是一次架构层面的重构。

Cosmos 3是一个面向物理AI的世界基础模型，提供“理解物理世界、预测会发生什么、决定怎么做”的底层能力。

和此前的Cosmos相比，早期版本主要面向机器人和自动驾驶开发者，做的是视频生成和物理世界模拟，本质上是个相对单模态的生成框架。Cosmos 3换了一套架构——混合Transformer，首次把视觉推理、世界生成和动作预测三件事统一到了一个系统里。

它能原生理解并生成文本、图像、视频、环境声音和动作，在物理准确性上达到领先水平，是全球首个完全开放的全能模型。英伟达称，它有望把物理AI的训练和评估周期从过去的数月压缩到数天。

黄仁勋预测，得益于多模态推理语言、视觉和世界模型的突破，物理AI的大爆炸即将来临。

Cosmos 3系列开放的前沿全能模型为开发者提供了代际飞跃的能力，用于构建能够在物理世界中感知、推理、规划和行动的机器人、自动驾驶汽车和视觉AI。

降低Physical AI门槛

英伟达与宇树联合发布H2 Plus——一台为研究和开发者准备的人形机器人样板机。

“样板”的意思是：宇树负责机器人本体，英伟达负责软件和计算平台，两边把硬件和软件预先整合好，开发团队拿到就能直接开始做技能开发，不用自己再花时间解决底层对接问题。它也是全球首款基于NVIDIA Isaac GR00T开发平台构建的开放式人形机器人。

这款样板机瞄准的是人形机器人开发中一个长期存在的痛点：硬件集成、数据采集、仿真、训练、评估、部署，各环节各自为战，整个流程高度碎片化。

英伟达表示，研究团队拿到一个机器人本体，往往要花大量时间在底层拼凑上，真正的技能开发反而被一再推后。H2 Plus尝试做的事，就是把这条路打通，让研究团队跳过底层集成，直接进入技能开发和真实场景验证。

在黄仁勋看来，人形机器人将为全球最大的产业带来物理AI，开启数万亿美元的经济机遇，而H2 Plus就是把前沿研究往工厂、仓库、物流系统这些真实场景推进的起点。

此外，英伟达还宣布，正式开源一套物理AI Skills（技能）工具集，覆盖机器人、自动驾驶、视觉AI和工业数字孪生等核心场景。

所谓“技能”，可以理解为英伟达把自己旗下的Cosmos、Omniverse、Isaac、Metropolis等平台的使用方式标准化之后，写成了智能体可以直接读懂、直接执行的操作指令，这些指令打包开源出来，就是这次发布的工具集。

智能体接到一个任务，比如生成一批检测缺陷的训练数据，它就知道该调用哪个模型、输出什么格式、怎么验证结果，整个过程自动跑完，不需要人一步步去操作每个环节。

升级AI存储：从“跑得快”到“管得住”

在3月份的圣何塞GTC上，英伟达发布了Vera BlueField-4 STX，当时黄仁勋重点讲的是“AI原生存储架构”，核心卖点是为智能体长上下文推理提供高性能KV Cache存储支撑。

现在，英伟达在STX基础上宣布新增一套安全能力，重点从“存储性能”变成了“存储安全”。

这里的核心逻辑和思考，是因为背景是企业AI的使用方式在变化。现在很多企业都积极部署智能体，当Agent接入企业系统，在无人直接监督的情况下持续读写、跨系统共享信息——谁在访问什么数据、有没有越权、有没有泄露，这都是企业头疼的问题。

英伟达的解法是，在加速存储的基础上加了一层安全能力——靠着一套统一的 NVIDIA DOCA 安全软件，以及在 BlueField-4 芯片里直接硬性执行策略，基于 STX 的平台可以实时检查和管控代理、数据和上下文记忆之间的互动，帮企业在 AI 数据路径上实现持续的策略执行。

黄仁勋解释称：“智能体把企业数据变成了一个实时、活生生的系统，而这个系统必须在数据移动之处、上下文存储之处、智能体行动之处都得到保护。Vera BlueField-4 STX要做的，就是用天生安全的设计，在芯片中以AI的速度执行信任”。

与台积电“互为供应商”

这次大会中，非常有意思的一个点是英伟达和台积电的合作——目前，台积电正利用NVIDIA技术提升先进晶圆厂的周转时间、能效、良率与运营生产力。

台积电和英伟达的关系，过去三十年只有一种形态：台积电帮英伟达造芯片。但现在，角色发生了微妙的变化，英伟达开始帮台积电“管工厂”。

黄仁勋表示：“英伟达和台积电已合作近三十年，不断推动计算的极限。台积电正在将英伟达的AI和加速计算引入晶圆厂内部，通过仿真、优化和AI应对全球最复杂的设计和制造挑战，以提高下一代芯片的速度、效率和良率。”

两者的关系，从单向的甲乙方，变成了双向的相互依存。

结语

回看这场发布会，英伟达正在围绕“Agent”拼凑新的蓝图。

Vera CPU为Agent调度任务，Vera Rubin为Agent提供算力，BlueField-4 STX为Agent守住数据安全，Cosmos 3让Agent理解物理世界，Nemotron+NemoClaw+OpenShell让Agent可以被组织、被调用、被约束，DGX Station for Windows让Agent进入企业员工的桌面，H2 Plus让Agent拥有身体，DSX和Skills让这一切可以被批量生产、批量部署。

从这个角度看，黄仁勋试图描绘的是一个新的计算时代。这也呼应了他在开场提到的“Agent AI和实用型人工智能时代已经到来”。

归根结底，黄仁勋这次想讲的就是一件事：当Agent成为AI基础设施，每一层都能有英伟达。

기술

Odaily 공식 커뮤니티에 가입하세요