GPU 가격 책정: 심판 없는 혼전
- 핵심 관점: 현재 GPU 컴퓨팅 파워 시장은 아직 성숙하지 않아 통일된 가격 기준과 표준화된 계약이 부족하여 시장 정보 혼란과 비효율성을 초래하고 있으며, 비축 및 파편화된 2차 시장 행위를 촉진하고 있다.
- 핵심 요소:
- 가격 지수 분기 현저: Bloomberg 터미널의 4개 지수 제공업체가 H100에 대해 제시한 가격 격차가 매우 크고 방향과 리듬이 일치하지 않아 시장이 합의된 기준을 결여하고 있음을 나타낸다.
- 다른 계약 유형별 가격 추세 분화: H100의 주문형, 현물 및 1년 예약 가격은 상승 폭과 시간적 시점에서 다른 양상을 보이며, 집계 지수는 구조적 차이를 가리고 있다.
- B200 시장 가격 스프레드 더 큼: B200의 주문형 가격은 단기간 내 급등했으나, 다른 지수의 시작점이 2달러 이상 차이나고 형태도 달라 시장 불투명성을 부각시킨다.
- 인프라 이중 결여: 시장은 신뢰할 수 있는 물리적 유통 네트워크와 표준화된 금융 계약, 투명한 기준 등 금융 인프라가 동시에 부족하다.
- 희소성이 가격에 효과적으로 전달되지 않음: 주문형 생산능력이 실제로 매진되었음에도 불구하고 가격 상승이 느린 것은 공급업체가 실시간 가격 정보를 결여하고 있어 시장이 효과적으로 청산되지 못함을 나타낸다.
- 시장에 7대 핵심 문제 존재: 합의된 기준 부재, 계약 비표준화, 납품 품질 보장 부재, 계약 유동성 부족 및 선도 곡선 부재 등을 포함한다.
- 비공식 2차 시장 촉진: 시장 불투명성으로 인해 비축 행위가 발생하며, 임차인들은 이미 GPU 클러스터를 아파트 재임대하듯이 재임대하기 시작했다.
원문 저자: David Lopez Mateos
원문 번역: Shenchao TechFlow
가이드: 미디어는 GPU 컴퓨팅 파워 가격의 등락을 하나의 숫자로 요약하는 것을 좋아하지만, 현실은 이렇다: Bloomberg 터미널의 네 가지 지수 제공업체가 제시한 가격은 서로 2달러 이상 차이가 나며, 방향과 리듬도 일치하지 않는다. 본문의 저자는 GPU 컴퓨팅 파워 거래 플랫폼 Compute Desk의 창립자인 David Lopez Mateos로, 그는 1차 거래 데이터를 활용해 H100과 B200의 실제 가격 구조를 분석하여 합의된 벤치마크, 표준 계약, 선물 곡선이 없는 원시 시장을 드러냈다. 컴퓨팅 파워는 단기 임대 아파트처럼 비축되고 재임대되고 있다.
미디어 헤드라인은 GPU 컴퓨팅 파워 가격이 급등하고 있다는 인상을 줄 것이다. 이 내러티브는 편안하며, '공급 긴축 + AI 수요 무한'이라는 거시적 프레임워크에 완벽하게 들어맞고, 또 안심시키는 한 가지 사실을 암시한다: 우리는 잘 작동하는 시장을 가지고 있으며, 가격 신호는 명확하게 읽을 수 있다.
하지만 우리는 그렇지 않다. 이 내러티브는 거의 전적으로 단일 지수에 기반을 두고 있으며, 그것이 암시하는 것은 암시되어서는 안 되는 것이다: GPU 임대 시장은 이미 하나의 숫자로 전체 상태를 대표할 수 있을 만큼 효율적이다.
공급 부족은 사실이지만, 다른 사람들이 느끼는 부족은 완전히 다르다. 당신이 누구인지, 어디에 있는지, 어떤 계약을 거래하는지, 어떤 컴퓨팅 파워 자산인지에 따라 다르다. 이러한 불투명함에 직면하여 시장의 자연스러운 반응은 질서 있는 가격 발견이 아니라 비축이다: 당신이 아직 필요하지 않을 수도 있는 GPU 시간을 확보하는 것이다. 왜냐하면 다음 달에 그것들을 어떤 가격으로든 살 수 있을지 확신할 수 없기 때문이다. 비축이 있고 투명한 벤치마크가 없는 곳에는 파편화된 2차 시장이 나타난다. Compute Desk에서 우리는 이미 임차인들이 대형 행사 기간 동안 아파트를 재임대하듯이 자신들의 클러스터를 재임대하는 것을 촉진했다. 이것은 가정이 아니라 실제로 일어나고 있는 일이다.
지수가 수렴하지 않음
성숙한 상품 시장에서는 서로 다른 방법론으로 구축된 지수들이 수렴하는 경향이 있다. 브렌트 원유와 WTI는 지리적 위치와 원유 품질로 인해 몇 달러의 가격 차이가 있지만, 방향적으로는 동기화되어 움직인다(그림 1). 이러한 수렴은 효율적인 시장의 표시이다.

그림 설명: 브렌트 대 WTI 원유 가격 추세 비교, 방향이 매우 일치함
현재 Bloomberg 터미널에는 세 개의 GPU 가격 지수 제공업체가 있다: Silicon Data, Ornn AI, Compute Desk. SemiAnalysis가 방금 네 번째를 공개했다. 100개 이상의 시장 참가자 설문 데이터를 기반으로 구축된 월간 H100 1년 계약 가격 지수이다. Silicon Data와 Ornn는 일일 H100 임대 지수를 발표하고, Compute Desk는 Hopper 아키텍처 수준에서 데이터를 집계하며, SemiAnalysis는 협상 후 계약가를 포착한다(매물가나 크롤링 가격이 아님). 방법론이 다르고, 빈도가 다르며, 동일한 시장에 대한 통찰 각도도 다르다. 그것들을 겹쳐서 보면, 차이가 명확하다(그림 2).

그림 설명: 네 가지 GPU 지수 중첩 비교, 가격 수준과 추세 모두 뚜렷한 차이를 보임
가격 상승은 정확히 어디서 일어나는가
Compute Desk 데이터를 사용하여 공급업체 유형과 계약 구조별로 H100의 가격 변동을 분해하고 Silicon Data의 SDH100RT 지수를 중첩할 수 있다(그림 3). 모든 지표는 가격이 오르고 있음을 보여주지만, 시작점과 폭은 지수와 계약 유형에 따라 크게 다르다.

그림 설명: 계약 유형별로 분리된 H100 가격 추세와 SDH100RT 지수 중첩
Compute Desk의 H100 신규 클라우드(neocloud) 데이터는 집계 지수보다 더 구체적인 이야기를 들려준다. 온디맨드(on-demand) 가격은 겨울 내내 비교적 안정적으로 약 3.00달러/시간을 유지하다가, 3월에 3.50달러로 급등했다. 스팟(spot) 가격은 더 변동성이 크고 낮았으며, 3월이 되어서야 소폭 상승 추세를 보였다. Silicon Data의 SDH100RT는 더 부드러운 꾸준한 상승을 보여주며, 같은 기간 2.00달러에서 2.64달러로 상승했다. 두 지수는 지속적으로 다른 가격대에 위치하며, 시간적 리듬에 대한 설명도 다르다: Compute Desk는 3월 급등을 말하고, Silicon Data는 느린 상승을 말한다.
1년 예약(reserved) 가격은 2월까지 기본적으로 횡보하다가, 3월 말에 1.90달러에서 2.64달러로 급등했다. 점진적인 추격이 아니라 갑작스러운 재평가였다. 이는 지속적인 구조적 수요에 의한 것보다는 온디맨드 시장이 긴축된 후 공급업체들이 집중적으로 계약 요율을 조정한 것처럼 보인다.
B200의 3월 이야기는 더 강력하다(그림 4). Compute Desk의 온디맨드 지수는 몇 주 만에 5.70달러에서 8.00달러 이상으로 폭등했다. Silicon Data의 SDB200RT는 4.40달러에서 6.11달러로 급등한 후 5.47달러로 하락했다. 두 지수 모두 이 파동을 기록했지만, 시작점은 2달러 이상 차이가 나며, 상승과 하락의 형태도 다르다. B200는 5개월 미만의 데이터, 더 적은 공급업체, 더 큰 가격 차이를 가지고 있으며, 두 지수는 매우 다른 렌즈로 동일한 사건을 관찰하고 있다.

그림 설명: B200 온디맨드 및 예약 가격 추세, Compute Desk와 Silicon Data 데이터 중첩
인프라 문제, 단순한 지역 차이만이 아님
상품 시장에는 베이시스 차이(basis differential)가 있다. 애팔래치아 천연가스는 교과서적인 사례이다: 막대한 매장량이 구조적으로 제한된 파이프라인 운송 용량 위에 놓여 있으며, 펜실베이니아-오하이오 회랑의 이용률은 종종 100%를 초과하고, Borealis Pipeline과 같은 신규 프로젝트는 2020년대 말이 되어야 가동된다.
GPU 시장도 유사한 상황이다: 버지니아의 H100 한 개와 프랑크푸르트의 H100 한 개는 동일한 경제적 상품이 아니다. 그러나 지역 차이만으로는 동일한 시장을 측정하는 지수들이 왜 이렇게 크게 차이나는지 설명할 수 없다. GPU 시장의 불일치는 애팔래치아 천연가스보다 더 깊다. 천연가스의 문제는 단일 결여 고리이다: 수요와 공급을 연결하는 파이프라인 운송 용량. 컴퓨팅 파워 시장의 인프라 격차는 수요와 공급 양쪽에 존재한다. 물리적 인프라—신뢰할 수 있는 컴퓨팅 파워 배포에 필요한 일관된 네트워크, 예측 가능한 구성, 예측 가능한 가용성—는 아직 성숙하지 않았으며, 때로는 전혀 작동하지 않는다. 금융 인프라—물리적 차이가 존재해도 가격 차이를 줄일 수 있는 표준화된 계약, 투명한 벤치마크, 차익 거래 메커니즘—또한 아직 존재하지 않는다.
데이터는 한 가지 이야기를 한다. 2026년 초 컴퓨팅 파워를 조달하려 했던 실제 경험은 더 따끔한 이야기를 한다. 모든 GPU 유형의 온디맨드 용량은 사실상 매진되었다. H100 64개를 찾는 것조차 어려웠다: Compute Desk는 공급업체의 90%가 온디맨드 클러스터 가용량이 제로임을 보여주며, 예약 시장도 상황이 크게 나아지지 않았다. 잘 작동하는 시장에서는 이러한 희소성 정도가 이미 가격을 새로운 균형점으로 밀어올렸을 것이다. 그러나 실제로는 그렇지 않았다. 이는 공급업체들 자신도 조정하기 위한 실시간 가격 정보가 부족함을 시사한다. 가격은 오르고 있지만, 시장을 정리하기에는 너무 느리게 오르고 있다. 매물가와 실제 지불 의사 사이의 격차는 비축, 재임대, 비공식적인 2차 시장 거래로 채워지고 있다.
무엇이 바뀌어야 하는가
현재 GPU 컴퓨팅 파워 시장에는 일곱 가지 핵심 문제가 존재한다:
합의된 벤치마크가 없다. 여러 지수가 공존하며 방법론이 다르고 결론이 상충된다.
집계 내러티브가 구조를 가린다. 하나의 'H100 가격'이라는 숫자가 다른 공급업체 유형과 계약 기간 사이의 엄청난 차이를 가린다.
거래 수준 데이터가 부족하다. 양자 시장에서 매물가와 실제 체결가 사이의 편차가 매우 크다.
계약 표준화가 없다. 대부분의 GPU 임대는 양자 협상이며, 조항이 각기 다르다. 더 짧고 더 표준화된 계약 기간은 유동성과 가격 발견을 개선할 수 있다.
전달 품질에 대한 보장이 없다. 상호 연결 토폴로지, CPU 페어링, 네트워크 스택 및 가동 시간 차이가 매우 크다. 구매자는 약속하기 전에 자신이 구매하는 컴퓨팅 파워의 품질이 무엇인지 알아야 한다.
계약에 유동성이 없다. 예약 기간 동안 수요가 변하면 선택지가 제한적이다: 비용을 감수하거나 비공식적으로 재임대해야 한다. 시장은 약속된 컴퓨팅 파워를 양도하거나 재판매할 수 있는 인프라가 필요하며, 이는 생산 능력이 가장 필요한 곳으로 흐르게 할 것이다.
선물 곡선(forward curve)이 없다. 선물 가격을 책정할 수 없으면 헤징도 할 수 없다. 이것이 바로 대출 기관이 GPU 담보에 40%-50% 할인을 적용하고, 자금 조달 비용이 높은 이유이다.
본 세기 가장 중요한 상품에 대한 정상적으로 작동하는 시장을 구축하는 것은 단일 선에서만 추진될 수 없다. 계량, 표준화, 계약 구조, 전달 품질, 유동성—이것들은 반드시 동시에 나아가야 하며, 그 전까지는 아무도 정말로 GPU 한 시간이 얼마의 가치가 있는지 말할 수 없다.


