황런쉰 GTC 연설 전문: 추론 시대 도래, 랍스터가 새로운 운영체제다

星球君的朋友们

Odaily资深作者

2026-03-17 02:37

이 기사는 약 16545자로, 전체를 읽는 데 약 24분이 소요됩니다

황런쉰은 에이전트(Agent)가 전통적인 SaaS 모델을 종식시킬 것이며, 미래에는 '연봉 + 토큰 예산'이 직장인의 새로운 표준이 될 것이라고 단언했다.

AI 요약

펼치기

핵심 관점: 엔비디아는 GTC 2026 컨퍼런스에서 칩 회사에서 'AI 인프라 및 팩토리 회사'로의 전환을 설명했으며, '토큰 팩토리 경제학'이라는 비즈니스 로직을 바탕으로 2027년까지 최소 1조 달러의 강력한 수요 전망을 제시했다.
핵심 요소:
1. 실적 가이던스: 황런쉰은 엔비디아의 2027년까지의 수요 전망이 최소 1조 달러이며 실제 수요는 더 높을 것이라고 밝혔고, 이 전망은 주가를 4.3% 이상 상승시키는 데 일조했다.
2. 토큰 팩토리 경제학: 미래의 데이터 센터는 AI 토큰을 생산하는 '공장'이며, 고정된 전력 제약 하에서 와트당 토큰 처리량이 가장 높은 시스템의 생산 비용이 가장 낮아, 이는 수익을 직접 결정한다.
3. 기술적 돌파구: 차세대 AI 컴퓨팅 시스템 Vera Rubin은 엔드투엔드 협력 설계를 통해 2년 만에 토큰 생성 속도를 350배 향상시켜, 무어의 법칙이 예측한 1.5배 향상을 훨씬 뛰어넘었다.
4. 생태계 및 소프트웨어 혁명: 오픈소스 프로젝트 OpenClaw는 에이전트 시대의 '운영체제'로 간주되며, 황런쉰은 모든 SaaS 회사가 AaaS(에이전트 서비스) 회사로 전환될 것이라고 단언했다.
5. 시장 구조: 엔비디아 매출의 60%는 상위 5대 클라우드 서비스 제공업체에서 발생하며, 40%는 주권 클라우드, 기업, 산업, 로봇, 에지 컴퓨팅 등 다양한 분야에 광범위하게 분포되어 있어 폭넓은 산업 적용을 보여준다.

원문 저자: Bao Yilong

원문 출처: Wall Street News

2026년 3월 16일, 엔비디아 GTC 2026 컨퍼런스가 정식 개막되었으며, 엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)이 기조 연설을 발표했습니다.

이 'AI 업계 연례 순례'로 여겨지는 컨퍼런스에서 젠슨 황은 엔비디아가 '칩 회사'에서 'AI 인프라 및 공장 회사'로의 변모를 설명했습니다. 시장이 가장 관심을 갖는 실적 지속성과 성장 가능성 문제에 직면하여, 젠슨 황은 미래 성장을 견인하는 근본적인 비즈니스 논리인 '토큰 팩토리 경제학(Token Factory Economics)'을 상세히 해체했습니다.

실적 가이던스 극도로 낙관적, "2027년 최소 1조 달러 수요"

지난 2년간 전 세계 AI 컴퓨팅 수요는 기하급수적으로 폭발했습니다. 대규모 언어 모델이 '인지', '생성'에서 '추론'과 '행동(작업 수행)'으로 진화함에 따라, 컴퓨팅 파워 소비량이 급격히 증가했습니다. 시장이 높은 관심을 보이는 주문과 매출 한계에 대해, 젠슨 황은 매우 강력한 전망을 제시했습니다.

젠슨 황은 연설에서 직설적으로 말했습니다:

작년 이맘때, 저는 2026년까지 블랙웰(Blackwell)과 루빈(Rubin)을 포함해 5,000억 달러의 높은 확신 수요를 본다고 말했습니다. 지금, 바로 이 자리에서, 저는 2027년까지 최소 1조 달러의 수요(at least $1 trillion)를 보고 있습니다.

젠슨 황의 1조 달러 예상은 한때 엔비디아 주가를 4.3% 이상 상승시켰습니다.

뿐만 아니라, 그는 이 숫자에 대해 다음과 같이 보충했습니다:

이게 합리적일까요? 제가 이제 말씀드릴 내용입니다. 사실, 우리는 공급이 수요를 따라가지 못할 수도 있습니다. 저는 확신합니다, 실제 컴퓨팅 수요는 이보다 훨씬 높을 것입니다.

젠슨 황은 현재 엔비디아 시스템이 전 세계 '비용이 가장 낮은 인프라'임을 입증했다고 지적했습니다. 엔비디아가 거의 모든 분야의 AI 모델을 실행할 수 있기 때문에, 이러한 범용성은 고객이 투자한 이 1조 달러가 충분히 활용되고 긴 수명 주기를 유지할 수 있게 합니다.

현재, 엔비디아 매출의 60%는 상위 5대 초대형 클라우드 서비스 제공업체에서 나오며, 나머지 40%는 주권 클라우드, 기업, 산업, 로봇, 에지 컴퓨팅 등 다양한 분야에 광범위하게 분포되어 있습니다.

토큰 팩토리 경제학, 와트당 성능이 비즈니스 생명선 결정

이 1조 달러 수요의 합리성을 설명하기 위해, 젠슨 황은 전 세계 기업 CEO들에게 새로운 비즈니스 사고 방식을 제시했습니다. 그는 미래의 데이터 센터는 더 이상 파일을 저장하는 창고가 아니라 토큰(AI 생성의 기본 단위)을 생산하는 '공장'이 될 것이라고 지적했습니다.

젠슨 황은 강조했습니다:

모든 데이터 센터, 모든 공장은 정의상 전력 제한을 받습니다. 1GW(기가와트) 공장은 결코 2GW가 되지 않습니다, 이건 물리와 원자의 법칙입니다. 고정된 전력 하에서, 누구의 와트당 토큰 처리량이 가장 높은지가 누구의 생산 비용이 가장 낮은지를 결정합니다.

젠슨 황은 미래의 AI 서비스를 다섯 가지 비즈니스 계층으로 나누었습니다:

무료 계층 (높은 처리량, 낮은 속도)
중급 계층 (~백만 토큰당 3달러)
고급 계층 (~백만 토큰당 6달러)
고속 계층 (~백만 토큰당 45달러)
초고속 계층 (~백만 토큰당 150달러)

그는 모델이 점점 커지고 컨텍스트가 점점 길어짐에 따라 AI는 더 똑똑해지지만, 토큰 생성 속도는 낮아질 것이라고 지적했습니다. 젠슨 황은 말했습니다:

이 토큰 공장에서, 당신의 처리량과 토큰 생성 속도는 내년의 정확한 수익으로 직접 전환될 것입니다.

젠슨 황은 엔비디아 아키텍처가 고객이 무료 계층에서 극도로 높은 처리량을 달성하는 동시에 가장 가치가 높은 추론 계층에서 성능을 놀라운 35배 향상시킬 수 있다고 강조했습니다.

Vera Rubin, 2년 만에 350배 가속, Groq가 극속 추론 보완

이러한 물리적 한계의 제약 하에서, 엔비디아는 역사상 가장 복잡한 AI 컴퓨팅 시스템인 Vera Rubin을 소개했습니다. 젠슨 황은 말했습니다:

과거에 호퍼(Hopper)를 언급할 때, 저는 칩 한 조각을 들어 올렸고, 그것은 귀여웠습니다. 하지만 Vera Rubin을 언급할 때, 모두가 생각하는 것은 전체 시스템입니다. 이 100% 액체 냉각, 전통적인 케이블을 완전히 제거한 시스템에서, 과거에는 이틀이 걸리던 랙 설치가 이제는 두 시간만에 가능합니다.

젠슨 황은 극도의 엔드투엔드 소프트웨어/하드웨어 공동 설계를 통해, Vera Rubin이 동일한 1GW 데이터 센터에서 놀라운 데이터 도약을 창출했다고 지적했습니다:

불과 2년 만에, 우리는 토큰 생성 속도를 2,200만에서 7억으로 높여 350배의 성장을 이루었습니다. 동일 기간 동안 무어의 법칙은 약 1.5배의 향상만을 가져올 수 있었습니다.

극속 추론(예: 초당 1000 토큰) 조건에서의 대역폭 병목 현상을 해결하기 위해, 엔비디아는 인수한 회사 Groq를 통합한 최종 솔루션인 비대칭적 분리 추론을 제시했습니다. 젠슨 황은 설명했습니다:

이 두 프로세서의 특징은 완전히 다릅니다. Groq 칩은 500MB의 SRAM을 가지고 있고, 한 개의 Rubin 칩은 288GB의 메모리를 가지고 있습니다.

젠슨 황은 엔비디아가 Dynamo 소프트웨어 시스템을 통해, 막대한 컴퓨팅과 비디오 메모리가 필요한 '사전 채우기(Pre-fill)' 단계를 Vera Rubin에 맡기고, 지연 시간에 극도로 민감한 '디코딩' 단계를 Groq에 맡긴다고 지적했습니다. 젠슨 황은 또한 기업 컴퓨팅 파워 구성에 대해 다음과 같은 조언을 했습니다:

당신의 작업이 주로 높은 처리량이라면, 100% Vera Rubin을 사용하십시오; 당신에게 프로그래밍 수준의 고가치 토큰 생성 수요가 많다면, 데이터 센터 규모의 25%를 Groq에 할당하십시오.

밝혀진 바에 따르면, 삼성이 위탁 생산하는 Groq LP30 칩은 이미 양산 중이며, 3분기 출하가 예상됩니다. 첫 번째 Vera Rubin 랙은 이미 Microsoft Azure 클라우드에서 운영 중입니다.

또한, 광 인터커넥트 기술에 대해, 젠슨 황은 세계 최초로 양산된 공동 패키징 광학(CPO) 스위치 Spectrum X를 선보였고, 시장의 '구리 퇴출, 광학 진입' 경로 논쟁을 잠재웠습니다:

우리는 더 많은 구리 케이블 생산 능력, 더 많은 광학 칩 생산 능력, 더 많은 CPO 생산 능력이 필요합니다.

에이전트가 전통적 SaaS 종식, "연봉 + 토큰"이 실리콘밸리 표준

하드웨어 장벽 외에도, 젠슨 황은 많은 지면을 AI 소프트웨어와 생태계의 혁명, 특히 에이전트(Agent)의 폭발적 성장에 할애했습니다.

그는 오픈소스 프로젝트 OpenClaw를 '인류 역사상 가장 인기 있는 오픈소스 프로젝트'로 묘사하며, 불과 몇 주 만에 Linux가 지난 30년 동안 이룬 성과를 능가했다고 말했습니다. 젠슨 황은 직설적으로 OpenClaw는 본질적으로 에이전트 컴퓨터의 '운영 체제'라고 말했습니다.

젠슨 황은 단언했습니다:

모든 SaaS(Software-as-a-Service) 회사는 AaaS(Agent-as-a-Service, 에이전트 서비스) 회사가 될 것입니다. 의심의 여지없이, 민감한 데이터에 접근하고 코드를 실행할 수 있는 이러한 에이전트가 안전하게 구현되도록 하기 위해, 엔비디아는 기업급 NeMo Claw 참조 설계를 출시하여 정책 엔진과 프라이버시 라우터를 추가했습니다.

일반 직장인에게도 이 변화는 코앞에 다가왔습니다. 젠슨 황은 미래의 새로운 직장 형태를 묘사했습니다:

미래에는, 우리 회사의 모든 엔지니어에게 연간 토큰 예산이 필요할 것입니다. 그들의 기본 연봉은 수십만 달러일 수 있고, 저는 그 위에 약 절반 정도의 금액을 토큰 할당량으로 추가하여 그들이 10배의 효율성 향상을 이루도록 할 것입니다. 이것은 이미 실리콘밸리의 새로운 채용 협상 카드입니다: 당신의 오퍼에 얼마나 많은 토큰이 포함되어 있나요?

연설 마지막에, 젠슨 황은 차세대 컴퓨팅 아키텍처인 Feynman을 '스포일러'했는데, 이는 처음으로 구리선과 CPO의 공동 수평 확장을 실현할 것입니다. 더욱 상상력을 자극하는 것은, 엔비디아가 우주에 배치되는 데이터 센터 컴퓨터 'Vera Rubin Space-1'을 연구 개발 중이며, 이는 AI 컴퓨팅 파워가 지구 밖으로 확장되는 상상의 공간을 완전히 열어젖혔습니다.

젠슨 황 GTC 2026 연설 전문, 전문 번역은 다음과 같습니다(AI 도구 보조):

사회자: 엔비디아 창립자 겸 CEO 젠슨 황을 무대에 모시겠습니다.

젠슨 황, 창립자 겸 CEO:

GTC에 오신 것을 환영합니다. 여러분께 상기시켜 드립니다, 이것은 기술 컨퍼런스입니다. 이른 아침에 줄을 서서 입장하는 많은 사람들을 보고, 자리에 앉아 계신 여러분을 볼 수 있어 매우 기쁩니다.

GTC에서 우리는 세 가지 주요 주제에 초점을 맞출 것입니다: 기술, 플랫폼, 생태계. 엔비디아는 현재 세 가지 플랫폼을 보유하고 있습니다: CUDA-X 플랫폼, 시스템 플랫폼, 그리고 우리가 최근에 출시한 AI 팩토리 플랫폼입니다.

본격적으로 시작하기 전에, 저는 우리의 워밍업 세션 사회자인 Conviction의 Sarah Guo, 세콰이어 캐피탈의 Alfred Lin(엔비디아의 첫 번째 벤처 투자자), 그리고 엔비디아의 첫 번째 주요 기관 투자자인 Gavin Baker에게 감사드립니다. 이 세 분은 기술에 대한 깊은 통찰력을 가지고 있으며, 전체 기술 생태계에 걸쳐 광범위한 영향력을 가지고 있습니다. 물론, 오늘 제가 직접 초청한 모든 귀빈 분들께도 감사드립니다. 이 올스타 팀에게 감사드립니다.

저는 또한 오늘 참석한 모든 기업들께 감사드립니다. 엔비디아는 플랫폼 회사입니다, 우리는 기술, 플랫폼, 그리고 풍부한 생태계를 가지고 있습니다. 오늘 참석한 기업들은 100조 달러 규모 산업에서 거의 모든 참여자를 대표하며, 총 450개의 회사가 이번 행사를 후원했습니다, 깊은 감사를 드립니다.

이번 컨퍼런스에는 총 1,000개의 기술 포럼, 2,000명의 연사가 있으며, 인공지능 '5층 케이크' 아키텍처의 모든 계층을 다룰 것입니다 — 토지, 전력, 기계실과 같은 인프라부터 칩, 플랫폼, 모델, 그리고 궁극적으로 전체 산업을 비상시키는 다양한 애플리케이션까지.

CUDA: 20년간의 기술 축적

모든 시작은 바로 여기에 있습니다. 올해는 CUDA 탄생 20주년입니다.

20년 동안, 우리는 항상 이 아키텍처의 연구 개발에 전념해 왔습니다. CUDA는 혁명적인 발명품입니다 — SIMT(단일 명령 다중 스레드) 기술은 개발자가 스칼라 코드로 프로그램을 작성하고 이를 다중 스레드 애플리케이션으로 확장할 수 있게 하며, 이전의 SIMD 아키텍처보다 프로그래밍 난이도가 훨씬 낮습니다. 우리는 최근에 개발자가 텐서 코어(Tensor Core)와 오늘날 인공지능이 의존하는 다양한 수학 연산 구조를 더 쉽게 프로그래밍할 수 있도록 돕는 Tiles 기능도 추가했습니다. 현재, CUDA는 수천 가지의 도구, 컴파일러, 프레임워크 및 라이브러리를 보유하고 있으며, 오

Odaily 공식 커뮤니티에 가입하세요