A16z: 제너레이티브 AI가 직면한 기회와 과제
원본 출처: Alpha Rabbit Research Notes
원본 출처: Alpha Rabbit Research Notes
원문 번역: 알파 래빗
A16Z는 최근 자신의 생각에 대해 이야기하는 또 다른 흥미로운 기사를 게시했습니다.생성적 AI 가치 포착예를 들어, 생성 AI 상용화의 현재 문제는 무엇입니까? 가장 큰 가치를 포착하는 곳은 어디입니까? 저자는 번역 후 내용의 일부에 주석을 달았습니다.
이 기사는 두 가지 주요 부분으로 구성되어 있습니다: 첫 번째 부분에는 생성 AI의 전체 현재 트랙에 대한 A16Z의 관찰과 존재하는 문제가 포함되어 있으며, 두 번째 부분에서는 문제 외에 가장 큰 가치를 포착할 수 있는 것이 무엇인지 설명합니다. 시설의(참고: 대부분 A16Z Portofolio입니다. 객관적이고 합리적인 태도로 읽으십시오. 이 기사는 프로젝트에 대한 투자 조언이나 추천을 구성하지 않습니다.)
첫 번째 레벨 제목
제너레이티브 AI란?
첫 번째 레벨 제목
파트 I: 관찰 및 예측
인공지능 애플리케이션은 규모 면에서 급속도로 확장되고 있지만 유지가 쉽지 않고 누구나 상업적 규모를 구축할 수 있는 것은 아니다.
생성 AI 기술의 초기 단계가 등장했습니다.
예를 들어 수백 개의 초기 AI 스타트업이 기본 모델을 개발하고 AI 네이티브 애플리케이션, 인프라 및 도구를 구축하기 시작하기 위해 시장에 뛰어들고 있습니다.
물론 핫 테크 트렌드도 많을 것이고, 과대 선전하는 경우도 있을 것이다. 그러나 생성 인공 지능의 붐으로 인해 많은 회사가 실제 수익을 창출했습니다.
예를 들어, Stable Diffusion 및 ChatGPT와 같은 모델은 사용자 성장에 대한 기록을 세웠고, 일부 앱은 출시 후 1년도 채 안 되어 연간 매출이 1억 달러에 도달했으며, 일부 작업에서 AI 모델의 성능은 인간의 성능보다 훨씬 뛰어났습니다.
우리는 기술 패러다임의 변화가 일어나고 있음을 발견했습니다. 하지만,연구해야 할 핵심 질문은 다음과 같습니다. 전체 시장에서 가치가 생성되는 위치는 어디입니까?
지난 1년 동안 우리는 수십 명의 제너레이티브 AI 스타트업 창업자 및 대기업 AI 전문가들과 이야기를 나눴습니다. 우리는 인프라가 전체 생성 AI 스택을 통해 가장 많은 매출과 수익을 얻을 수 있기 때문에 지금까지 인프라 제공업체가 이 시장에서 가장 큰 승자가 될 가능성이 높다는 것을 관찰했습니다.
애플리케이션 개발에 주력하는 회사의 매출 성장은 매우 빠르지만 이러한 회사는 사용자 유지, 제품 차별화 및 총 수익 마진 측면에서 종종 약점을 가지고 있습니다.그러나 대부분의 모델 공급업체는 아직 대규모 상용화 기능을 마스터하지 못했습니다.
더 정확히 말하면 생성적 인공 지능 모델을 교육하고 이 기술을 새로운 응용 프로그램에 적용할 수 있는 것과 같이 가장 많은 가치를 창출할 수 있는 회사는 아직 업계에서 대부분의 가치를 완전히 포착하지 못했습니다. 따라서 이면의 산업 동향을 예측하기가 그리 쉽지 않습니다.
그러나 전체 산업 스택의 어떤 부분이 진정으로 차별화되고 방어할 수 있는지 이해하는 방법을 찾는 것이 중요합니다. 왜냐하면 이 부분은 전체 시장 구조(즉, 수평 및 수직 회사 개발) 및 장기적인 가치 동인에 영향을 미칠 수 있기 때문입니다. (예: 이익 마진 및 사용자 유지)은 상당한 영향을 미칩니다.
그러나 지금까지는 기존 기업의 전통적인 비즈니스 해자 외에 (생성 AI의) 스택에서 구조적 방어 가능성을 찾기가 어려웠습니다.
보조 제목
기술 스택: 인프라, AI 모델 및 애플리케이션
생성적 인공 지능 트랙과 시장이 어떻게 형성되는지 이해하려면 먼저 전체 산업의 현재 스택을 정의해야 합니다.

전체 생성 AI 스택은 다음 세 계층으로 나눌 수 있습니다.
1. 일반적으로 자체 모델 파이프라인("엔드투엔드 애플리케이션") 또는 타사 API에 의존
(Alpha Rabbit의 연구 노트에 대한 참고 사항: 여기서 말하는 모델 파이프라인은 한 모델의 출력을 다음 모델의 입력으로 참조합니다.)
2. 독점 API 또는 오픈 소스 체크포인트(호스팅된 솔루션 필요)로 사용 가능한 AI 제품을 구동하는 모델
(참고: 이 섹션에서는 전체 모델의 구성 방법과 사전 학습된 모델(체크포인트라고도 함)이 공개되어 있거나 전체 모델의 구성 방법과 사전 학습된 모델이 비밀로 유지되어야 하며, 하나의 인터페이스 API만 열려있습니다. , 전자라면 직접 학습/미세조정/추론을 실행해야 하므로 어떤 환경, 어떤 하드웨어에서 실행할 수 있는지 알아야 하므로 누군가는 필요합니다. 모델 실행 환경을 처리하기 위한 호스팅 플랫폼 제공)
3. 제너레이티브 AI 모델을 위한 교육 및 추론 워크로드를 실행하는 인프라 제공자(예: 클라우드 플랫폼 및 하드웨어 제조업체)
여기서 말하는 것은 전체 시장의 생태 지도가 아니라 시장을 분석하기 위한 틀이라는 점에 유의해야 합니다. 강력한 AIGC 애플리케이션은 이 영역이 아직 완전한 표준화에 도달하지 않았기 때문에 MOps 또는 LLMops 도구에 대해 심도 있게 논의하지 않았으며 기회가 있을 때 계속 논의할 것입니다.
제너레이티브 AI 애플리케이션의 첫 번째 물결이 확장되기 시작했지만 유지 및 차별화가 쉽지 않음
이전 기술 주기에서 전통적인 관점은 크고 독립적인 회사를 구축하려면 최종 고객이 있어야 하며 최종 고객에는 개인 소비자와 B2B 구매자가 포함되어야 한다는 것이었습니다.
이러한 전통적인 관점 때문에 생성적 인공지능의 가장 큰 기회는 최종 사용자 중심의 응용 프로그램을 만들 수 있는 회사에 있다고 누구나 생각하기 쉽습니다.
그러나 지금까지는 반드시 그런 것은 아닙니다.
제너레이티브 AI 애플리케이션의 성장은 주로 이미지 생성, 카피라이팅 및 코딩과 같은 매우 새롭고 사용 사례에 의해 크게 증가했으며 이 세 가지 제품 범주의 연간 수익은 미화 1억 달러를 초과했습니다.
그러나 성장만으로는 지속적인 소프트웨어 회사를 구축하기에 충분하지 않으며, 핵심은 이러한 성장이 수익성이 있어야 한다는 것, 즉 사용자와 고객이 일단 가입하면 수익을 창출할 수 있고(높은 매출총이익), 이 수익이 지속 가능해야 한다는 것입니다. 장기적으로 지속 가능합니다(높은 보유율).
회사 간에 강력한 기술적 차별화가 없는 경우 B2B 및 B2C 애플리케이션은 네트워크 효과, 데이터 이점 또는 점점 더 복잡해지는 워크플로 구축을 통해서만 성공할 수 있습니다.
그러나 생성 인공 지능 분야에서는 위의 가정이 사실이 아닐 수 있습니다.우리가 조사한 제너레이티브 인공지능 앱을 만드는 스타트업 기업들 사이에서 매출총이익률은 큰 차이를 보인다. 모델 비용으로.
현재 Top-of-Funnel(Top-of-Funnel) 성장을 볼 수 있지만,그러나 현재의 고객 확보 전략이 지속될 수 있을지는 불분명하다., 지불 획득 효율성과 유지율이 떨어지기 시작하는 것을 많이 보았기 때문입니다.
현재 시장에 나와 있는 많은 응용 프로그램은 이러한 응용 프로그램이 주로 유사한 기본 인공 지능 모델에 의존하고 있으며 분명히 독점적인 네트워크 효과를 가질 수 있고 다른 경쟁업체가 복제하기 어려운 킬러 응용 프로그램 및 데이터를 찾지 못했기 때문에 차별화가 부족합니다.
보조 제목
미래를 내다보면 생성 AI 애플리케이션이 직면하는 문제는 무엇입니까?
수직적 통합("모델 + 애플리케이션")측면
인공 지능 모델을 소비자 서비스로 사용하면 응용 프로그램 개발자는 소규모 팀 모델로 빠르게 반복하고 기술 발전으로 점차 모델 공급자를 대체할 수 있습니다. 그러나 다른 개발자들은 이에 동의하지 않고 제품이 모델이며 처음부터 훈련하는 것이 독점 제품 데이터에 대한 지속적인 재훈련을 의미하는 방어력을 만드는 유일한 방법이라고 믿습니다. 그러나 이를 위해서는 더 많은 자본이 필요하고 안정적인 제품 팀을 희생해야 합니다.
기능 및 앱 빌드
생성 AI 제품은 데스크톱 앱, 모바일 앱, Figma/Photoshop 플러그인, Chrome 확장 프로그램, 심지어 Discord 봇까지 다양한 형태로 제공됩니다. 사용자 인터페이스가 더 간단하기 때문에 사용자가 이미 사용하고 있고 습관이 있는 인공 지능 제품을 통합하는 것이 더 쉽습니다. 하지만 이 회사들 중 어느 회사가 독립 회사가 될까요? AI 거인 Microsoft 또는 Google에 흡수되는 것은 무엇입니까?
Gartner가 발표한 하이퍼 사이클과 일치할까요?
첫 번째 레벨 제목
2부: 생성 인공 지능의 대규모 상용 구현
첫 번째 부분에서 우리는 생성 AI의 현재 스택과 그것이 직면한 몇 가지 문제에 대해 이야기했습니다. 두 번째 부분은 계속됩니다.
생성 인공 지능의 대규모 상용 구현 정보
승자독식은 어디에서 가장 큰 가치를 얻습니까?
위에 다른 질문이 있습니까?
현재 업계의 문제점은 무엇입니까?
모델의 발명으로 생성형 인공지능 기술이 널리 알려졌지만 아직 대규모 상용화 수준에는 이르지 못했다.
오늘날 우리는 Google, OpenAI, Stability와 같은 회사의 연구 노력과 이들 회사의 엔지니어링 노력 없이는 이러한 성공적인 생성 AI 기술을 목격하지 못했을 것입니다. 우리가 본 새로운 모델 아키텍처든, 훈련 파이프라인의 확장이든, 주로 현재 LLM(대형 언어 모델) 및 이미지 모델의 강력한 기능 때문입니다.
하지만 이들 기업의 매출을 보면 이렇게 많은 사용량과 시장의 인기에 비하면 매출이 그리 높지 않다. 이미지 생성 측면에서 Stable Diffusion 커뮤니티가 폭발적으로 증가했습니다. 그러나 Stability의 주요 체크포인트는 열려 있으며 이것이 Stability 사업의 핵심 신조입니다.
자연어 모델 측면에서 OpenAI는 GPT-3/3.5 및 ChatGPT로 알려져 있습니다.하지만 지금까지는 OpenAI 위에 구축된 킬러 앱이 적었고 가격도 한 번 떨어졌습니다. (아래 참조)
(가격이 인하된 이유를 생각해 보십시오.)

물론 이는 현재 일시적인 현상일 수 있다. 안정성은 상용화에 치중하지 않는 새로운 형태의 스타트업입니다. OpenAI는 대규모 사업을 할 수 있는 잠재력을 가지고 있으며 더 많은 킬러 앱이 구축됨에 따라 OpenAI는 모든 자연어 산업 카테고리 수익의 상당 부분을 얻을 수 있습니다.특히 OpenAI가 Microsoft의 포트폴리오에 잘 통합되면 이러한 모델의 높은 사용률은 막대한 수익으로 이어질 수 있습니다.
그러나 숨겨진 위험도 있습니다.
예를 들어 모델이 오픈 소스인 경우 대규모 모델 교육 비용(수천 또는 수억 달러)을 부담하지 않는 다른 회사를 포함하여 누구나 호스팅할 수 있습니다.
그리고 폐쇄 소스 모델이 그 지배력을 무기한으로 유지할 수 있는지는 확실하지 않습니다. 예를 들어 Anthropic, Cohere 및 Character.ai와 같은 회사에서 구축한 대규모 모델 LLM이 OpenAI의 성능 수준에 접근하고 유사한 데이터 세트(즉, 인터넷)에서 교육을 받고 유사한 모델 아키텍처를 사용하는 것을 보기 시작했다고 가정해 보겠습니다.
Stable Diffusion 예제는 오픈 소스 모델이 특정 수준의 성능과 커뮤니티 지원을 달성하는 경우 동일한 트랙의 다른 대안이 경쟁하기가 매우 어려울 수 있음을 보여줍니다.
아마도 지금까지 모델 공급자에게 가장 확실한 이득은 호스팅과 관련된 상용화일 것입니다.(참고: 이는 앞선 글에서 언급한 전체 모델 및 선행 학습된 모델(체크포인트라고도 함)의 구성 방법을 공개하거나 전체 모델 및 선행 학습된 모델의 구성 방법을 비밀로 유지하는 것을 의미합니다. 인터페이스 API는 1개만 열려있고 전자라면 스스로 훈련/미세조정/추리를 해야 하므로 어떤 환경, 어떤 하드웨어에서 구동이 가능한지 알아야 하므로 누군가 제공해주어야 합니다. 모델 운영 환경을 처리하기 위한 호스팅 플랫폼);
그리고 독점 API(예: OpenAI)에 대한 수요가 빠르게 증가하고 있습니다. 예를 들어, Hugging Face, Replicate와 같은 오픈 소스 모델 호스팅 서비스의 등장은 모델 생산자와 소비자 사이에 간접적인 네트워크 효과까지 창출하면서 모델을 쉽게 공유하고 통합할 수 있는 허브가 되었습니다. 기업 고객과의 미세 조정 및 에스크로 계약을 통해 회사의 수익성을 달성할 수 있다는 강한 가정도 있습니다.
그러나 모델 공급자는 여전히 다음과 같은 문제에 직면해 있습니다.
상품화하다.시간이 지남에 따라 AI 모델의 성능이 수렴될 것이라는 견해가 지배적입니다. 앱 개발자와 대화할 때 텍스트 및 이미지 모델 모두에서 최고의 플레이어가 있기 때문에 지금까지 이러한 수준의 일관된 성능은 발생하지 않았습니다. 이러한 회사의 장점은 고유한 모델 아키텍처가 아니라 높은 자본 요구 사항, 독점 제품 상호 작용 데이터 및 부족한 AI 인재를 기반으로 합니다.
그러나 이것이 회사에 장기적으로 지속 가능한 이점이 될 수 있습니까?
모델 공급업체에서 이탈할 위험이 있습니다.모델 공급업체에 의존하는 것은 많은 앱 회사가 공급업체를 시작하고 비즈니스를 성장시키는 방법이지만 규모에 도달하면 앱 개발자는 자체 모델을 구축 및/또는 호스팅할 인센티브를 갖게 됩니다. 많은 모델 공급업체는 고객 분포가 고르지 않으며 소수의 애플리케이션이 대부분의 수익을 차지합니다.이러한 고객이 공급자의 모델을 사용하지 않고 자체 내부 인공 지능 모델 개발로 전환하면 어떻게 됩니까?
자본이 중요할까요?제너레이티브 AI의 비전은 너무 커서 많은 모델 공급업체가 공익을 그들의 임무에 통합하기 시작했습니다. 이것은 자금 조달을 전혀 방해하지 않았습니다. 그러나 논의해야 할 것은 모델 공급업체가 정말로 가치를 포착할 의향이 있는지, 그리고 그들이 그것을 얻어야 하는지 여부입니다.
인프라를 확보하고 세상을 얻으십시오.
Generative AI의 모든 항목은 클라우드 호스팅 GPU(또는 TPU) 서비스를 사용합니다. 모델 벤더, 연구실, 교육 워크로드 실행, 추론/미세 조정을 실행하는 호스팅 회사 등 FLOPS는 생성 AI의 핵심입니다.
(Alpha Rabbit 연구 노트에 대한 참고 사항: FLOPS는 초당 부동 소수점 연산의 약자로 초당 부동 소수점 연산 수를 의미하며 계산 속도로 이해됩니다. 하드웨어 성능을 측정하는 지표입니다. 보통 우리가 평가할 때 일단 정확도를 봐라 정확도가 부족할 땐 내 모델이 얼마나 빨리 예측하는지, 배포했을 때 메모리가 얼마나 작은지 다른 사람들에게 알려줘도 소용없지만 모델이 일정 정확도에 도달하면 정도, 모델을 평가하려면 추가 평가 지표가 필요합니다.
여기에는 다음이 포함됩니다.
1) GPU와 같은 하드웨어의 성능 요구 사항을 반영한 정방향 전파에 필요한 컴퓨팅 성능
2) 점유된 메모리 크기를 반영하는 매개변수의 수. 이 두 지표를 추가하는 이유는 무엇입니까? 이것은 모델 알고리즘의 구현과 관련이 있기 때문입니다. 예를 들어 휴대폰과 자동차에 딥 러닝 모델을 배포하려는 경우 모델 크기와 컴퓨팅 성능에 대한 엄격한 요구 사항이 있습니다. 모든 사람은 모델 매개변수가 무엇이고 어떻게 계산하는지 알아야 하지만 순방향 전파에 필요한 컴퓨팅 성능은 여전히 약간 의심스러울 수 있습니다. 순방향 전파에 필요한 총 컴퓨팅 성능은 다음과 같습니다. FLOP로 구현됩니다.
참고 자료: Zhihu A Chai Ben Chai: https://zhuanlan.zhihu.com/p/137719986 )
따라서 제너레이티브 AI의 많은 돈이 결국 인프라 회사로 가게 됩니다. 대략적인 추정치로서, 평균적으로 애플리케이션 회사는 매출의 약 20-40%를 고객당 추론 및 미세 조정에 사용합니다. 그리고 그 수익은 일반적으로 클라우드 인프라에 수익의 약 절반을 지출하는 컴퓨팅 인스턴스 또는 타사 모델 제공업체에 대해 클라우드 공급자에게 직접 지급됩니다.따라서 추정할 수 있습니다. 오늘날 총 생성 AI 수익의 10~20%가 클라우드 공급자에게 전달됩니다.
또한 자체 모델을 교육하는 신생 기업도 수십억 달러의 벤처 자본을 모았으며 대부분(초기 라운드에서 최대 80-90%)은 일반적으로 클라우드 공급자에 사용됩니다. 많은 기술 회사는 외부 클라우드 공급자 또는 하드웨어 제조업체와 직접 모델 교육에 연간 수억 달러를 지출합니다.
AIGC 초기 시장의 경우 대부분이 세 가지 주요 클라우드에 사용됩니다.AWS(Amazon Web Services), GCP(Google Cloud) 및 Microsoft Azure와 같은 클라우드 제공업체는 가장 포괄적이고 안정적이며 비용 경쟁력 있는 플랫폼을 확보하기 위해 연간 총 1,000억 달러 이상의 자본 지출을 지출합니다.
특히 생성 인공 지능 분야에서 이러한 클라우드 공급업체는 부족한 하드웨어(예: Nvidia A 100 및 H 100 GPU)에 우선 순위를 부여할 수 있습니다.
(알파 래빗 참고: 100은 다음과 같습니다.
다음 기사도 읽어보세요.속보 | 미국이 Nvidia의 중국에 대한 일부 제품 판매를 중단한다는 해석 20220901

결과적으로 Oracle과 같은 도전자 또는 Coreweave 및 Lambda Labs와 같은 신생 기업이 비용, 사용성 및 개인화된 지원 측면에서 대규모 모델 개발자를 대상으로 하는 솔루션으로 급증하는 경쟁이 등장했습니다. 세분화된 리소스 추상화(즉, 컨테이너)와 달리 대규모 클라우드는 GPU 가상화의 한계로 인해 가상 머신 인스턴스만 제공합니다.
[Alpha Rabbit의 연구 노트에 대한 참고 사항: 예를 들어, 우리가 인터넷에서 쇼핑하고, 메시지를 보내고, 온라인 뱅킹을 사용하려고 할 때 우리는 모두 클라우드 기반 서버와 상호 작용하고 있습니다. 즉, 우리가 클라이언트(휴대폰, 컴퓨터, 아이패드)를 사용하여 다양한 작업을 수행할 때 서버에 요청을 보내야 하며 각 작업은 해당 서버에서 각 요청을 처리한 다음 응답을 반환해야 합니다.
동시에 수천 명의 사용자가 대량의 요청 및 응답을 수행하려면 강력한 컴퓨팅 성능이 필요합니다(Double Eleven에서 쇼핑할 때 수많은 사용자가 미친 듯이 동시에 주문을 하면 장바구니가 갑자기 멈출 때를 생각해 보십시오) , 이 때 컴퓨팅 파워는 매우 중요합니다. 앞에서 말했듯이 가상 머신은 컴퓨팅 기능의 일부입니다.클라우드 서비스 공급자의 클라우드 컴퓨팅 솔루션을 사용할 때 기업의 현재 기능과 요구 사항에 따라 가상 머신을 사용하도록 선택할 수 있습니다.
가상 머신이란 무엇입니까?
완전히 고립된 시스템에서 실제 컴퓨터의 기능을 제공할 수 있는 컴퓨터 시스템의 에뮬레이터입니다. 시스템 가상 머신은 우리가 사용하는 Windows 시스템과 같은 완전한 운영 체제를 실행할 수 있는 완전한 시스템 플랫폼을 제공할 수 있습니다. MAC OS 시스템 등 프로그램 가상 머신은 에뮬레이터에서 독립적으로 실행할 수 있는 컴퓨터 프로그램입니다. 즉, 클라우드 서비스 제공자가 제공하는 가상 머신을 구매하면 클라우드 서비스 제공자로부터 땅을 구매한 후 가상 머신에서 다양한 소프트웨어를 설치하고 다양한 작업을 실행할 수 있습니다. 직접 사서 여기 온 땅에 집을 짓는 것과 같습니다.
컨테이너란 무엇입니까? 용기, 우리는 일반적으로 밥그릇, 식기 및 물건을 담을 수 있는 기타 도구로 이해합니다. IT에서 자주 언급되는 컨테이너 기술은? 사실 이 단어는 리눅스 컨테이너(Linux Container)를 번역한 것인데, 영어에서 컨테이너(Container)라는 단어는 컨테이너(Container)와 컨테이너(Container)의 의미를 가지고 있습니다(기술적으로 비유하자면 컨테이너의 주요 의미는 컨테이너입니다). 하지만 컨테이너는 중국어로 읽기 쉽기 때문에 중국어 컨테이너를 일반적인 단어로 사용합니다. Linux Container 기술을 생생하게 이해하고 싶다면 이 글을 읽고 마음속으로 해변 화물 터미널의 컨테이너를 상상해 보십시오.

화물터미널에 있는 컨테이너는 화물을 운반하는 용도로 규격화된 철제 박스입니다. 컨테이너의 특징은 모두 정사각형이고 형식이 균일하며 서로 쌓을 수 있다는 것입니다.
이와 같이 화물을 컨테이너에 실어 거대한 화물선에 실을 수 있게 되고, 화물을 운송해야 하는 제조업자는 화물을 보다 빠르고 편리하게 배송할 수 있게 되었고, 컨테이너의 등장은 제조업자에게 보다 효율적인 운송 서비스를 제공하게 되었습니다. 이 편리한 운송 서비스에 따르면 중국 환경에서 사용하기 쉽도록 컨테이너의 이미지 개념을 컴퓨터 세계에서 인용한다. ]
지금까지 제너레이티브 AI에서 가장 큰 승자는 AI 워크로드의 대부분을 실행하는 Nvidia입니다.2023 회계연도 3분기 엔비디아의 데이터 센터 GPU 매출 38억 달러는 주로 생성 AI 사용 사례에 전념했습니다.
(GPU: 그래픽 처리 장치(영어: Graphics Processing Unit, 약어: GPU)는 디스플레이 코어, 비주얼 프로세서, 디스플레이 칩이라고도 하며 개인용 컴퓨터, 워크스테이션, 게임 콘솔, 및 마이크로프로세서에서 이미지 및 그래픽 관련 컴퓨팅 작업을 수행하기 위한 일부 모바일 장치(예: 태블릿 컴퓨터), 스마트폰 등)
NVIDIA는 GPU 생태계에 대한 수십 년간의 투자와 학계의 장기적인 심층 애플리케이션을 통해 이 사업을 중심으로 강력한 해자를 구축했습니다. 최근 분석에 따르면 Nvidia의 GPU는 최고의 AI 칩 스타트업보다 연구 논문에서 90배 더 자주 인용되었습니다.
물론 Google TPU, AMD Instinct GPU, AWS Inferentia 및 Trainium 칩, Cerebras, Sambanova 및 Graphcore와 같은 신생 기업을 포함한 다른 하드웨어 옵션도 존재합니다.
인텔은 자체 고급 Habana 칩과 Ponte Vecchio GPU로 시장에 진입했습니다. 그러나 지금까지 Intel의 새로운 칩 중 상당한 시장 점유율을 확보한 제품은 거의 없습니다. 다른 두 가지 예외는 TPU가 꾸준한 확산 커뮤니티와 일부 대규모 GCP 거래에서 관심을 끌고 있는 Google과 Nvidia GPU를 포함하여 여기에 나열된 모든 칩을 만드는 것으로 생각되는 TSMC입니다(Intel은 자체 팹과 TSMC를 사용하여 칩을 만드십시오).
우리가 발견한 것: 인프라는 수익성 있고 지속적이며 겉보기에 방어할 수 있는 스택 계층입니다.
그러나 인프라 회사가 대답해야 하는 질문은 다음과 같습니다.
상태 비저장 워크로드는 어떻습니까?
이것이 의미하는 바는 Nvidia GPU를 어디에서 대여하든 상관없이 동일하다는 것입니다. 대부분의 AI 워크로드는 상태 비저장입니다. 즉, 모델 추론에는 연결된 데이터베이스 또는 스토리지가 필요하지 않습니다(참고: 모델 가중치 자체를 제외하고 외부 스토리지 또는 데이터베이스가 필요하지 않음). 이는 AI 워크로드가 기존 애플리케이션 워크로드보다 클라우드로 마이그레이션하기 더 쉬울 수 있음을 의미합니다. 이 경우 클라우드 공급자는 고객이 더 저렴한 옵션을 선택하지 못하도록 하는 끈기를 어떻게 생성합니까?
칩이 더 이상 부족하지 않다면?
GPU 공급이 부족하기 때문에 클라우드 공급자와 Nvidia의 가격은 비쌀 수 있습니다. 벤더들은 A 100의 상장 가격이 출시 이후 계속해서 상승하고 있으며, 이는 컴퓨팅 하드웨어로서는 매우 이례적인 일이라고 말했습니다. 그렇다면 생산량 증가 및/또는 새로운 하드웨어 플랫폼 채택을 통해 이러한 공급 제약이 궁극적으로 제거될 때 클라우드 공급자는 어떻게 될까요?
Xinjinyun은 포위 공격을 뚫을 수 있습니까?
우리는 수직 클라우드가 보다 전문화된 제품으로 Big Three에서 시장 점유율을 차지할 것이라고 생각합니다. 지금까지 AI에서 새로운 클라우드 플레이어는 적당한 기술 차별화와 Nvidia 지원으로 추진력을 얻었습니다. 예를 들어 기존 클라우드 공급자는 가장 큰 고객이자 신흥 경쟁자입니다. 따라서 이러한 신흥 클라우드 회사에 대한 장기적인 질문은 3대 거대 기업의 규모 이점을 극복할 수 있는가 하는 것입니다.
그렇다면 가치가 가장 많이 축적되는 곳은 어디일까요? 가장 큰 가치를 포착하기 위해 투표하는 방법은 무엇입니까?
아직 명확한 답은 없지만 현재 사용 가능한 생성 AI에 대한 초기 데이터와 초기 AI 및 기계 학습 스타트업의 경험을 결합하여 다음과 같은 판단을 내립니다.
오늘날의 생성 AI에서는 어떤 의미에서든 시스템적 해자가 거의 없습니다.우리는 현재 응용 프로그램을 보고 제품 차별화가 많지 않으며 그 징후가 매우 분명합니다. 그 이유는 이러한 앱이 유사한 AI 모델을 사용하기 때문입니다. 따라서 현재 모델이 직면하고 있는 것은 장기간에 걸쳐 차이점이 어디인지 판단하는 것이 불가능하다는 것입니다. 유사한 데이터 세트 및 아키텍처에 대해 교육을 받았으며 클라우드 공급자도 유사하고 모든 사람의 기술은 기본적으로 동일합니다. , 동일한 GPU를 실행하기 때문에 하드웨어 회사조차도 동일한 공장에서 칩을 만듭니다.
틀림없이,여전히 표준 해자가 있습니다. 규모의 해자가 존재합니다. 예를 들어, 동일한 스타트업, 내가 당신보다 더 나은 자금 조달 능력을 가지고 있거나, 공급망 해자가 있고, 당신은 그렇지 않은 GPU가 있습니다. 또는 생태계 해자가 있습니다. 예를 들어 , 내 소프트웨어는 당신보다 더 많은 사용자를 가지고 있고 더 일찍 시작했고 시간과 사용자 규모의 장벽이 있습니다. 판매 분야의 해자, 상품 판매에 있어 내가 너보다 낫다, 채널의 리더, 또는 데이터 분야의 해자, 예를 들어 내가 너보다 더 많은 데이터를 수집합니다.
그러나 이러한 해자는 장기적인 이점이 없으며 지속 가능하지 않습니다. 또한 이러한 스택에서 강력하고 즉각적인 네트워크 효과가 우세할 위치를 정확히 말하기에는 너무 이릅니다.
사용 가능한 데이터를 기반으로 생성 AI에 장기적인 승자 독식 기회가 있는지 여부를 말하기에는 너무 이릅니다.
이상하게 들리겠지만 우리에게는 좋은 소식입니다.
전체 시장의 잠재적 규모는 정확히 파악하기 어렵기 때문에 소프트웨어 및 모든 사람의 시도와 밀접한 관련이 있습니다. 우리는 많은 플레이어가 이 시장에 참여할 것으로 기대하며 모두가 생성 AI 스택의 모든 수준에서 양심적으로 경쟁할 것입니다. 우리는 수평과 수직으로 운영할 수 있는 성공적인 기업을 기대합니다.
그러나 이것은 최종 시장과 사용자에 의해 결정됩니다. 예를 들어 최종 제품의 주요 차별화 요소가 AI 기술 자체에 있는 경우 수직화(즉, 사용자 대면 애플리케이션과 기본 모델의 긴밀한 통합)가 승리할 가능성이 높습니다.
그리고 AI가 더 큰 롱테일 기능 세트의 일부라면 아마도 수평화가 진정한 추세일 것입니다. 물론 시간이 지남에 따라 더 전통적인 해자와 새로운 해자가 형성되는 것을 볼 수 있습니다.
그럼에도 불구하고 한 가지 확실한 것은 생성 AI가 산업을 변화시키고 있다는 것입니다. 모두가 계속해서 배우고 많은 가치가 공개될 것이며 그 결과 기술 생태계가 바뀔 것입니다. 모두가 가고 있습니다.


