원작자 : Haotian (X: @tmel0211 )
한편, Meta는 Scale AI 지분의 거의 절반을 인수하기 위해 148억 달러를 투자했고, 이 거대 기업이 데이터 라벨링의 가격을 엄청나게 높게 책정한 것에 실리콘 밸리 전체가 충격을 받았습니다. 반면, TGE를 앞두고 있는 @SaharaLabsAI는 여전히 개념에만 의존하고 스스로를 증명하지 못한다는 Web3 AI 편향이라는 딱지에 갇혀 있습니다. 이처럼 엄청난 대조를 보이는 이면에 시장은 무엇을 간과하고 있을까요?
우선, 데이터 라벨링은 분산형 컴퓨팅 파워 집계보다 더 가치 있는 트랙입니다.
유휴 GPU를 활용하여 클라우드 컴퓨팅 거대 기업에 도전하는 이야기는 분명 흥미롭지만, 컴퓨팅 파워는 본질적으로 표준화된 상품이며, 그 차이는 주로 가격과 가용성에 있습니다. 가격 우위는 거대 기업의 독점에서 틈새를 찾을 수 있는 것처럼 보이지만, 가용성은 지리적 분포, 네트워크 지연 시간, 그리고 불충분한 사용자 인센티브에 따라 달라집니다. 거대 기업이 가격을 인하하거나 공급을 늘리면 이러한 우위는 순식간에 사라질 것입니다.
데이터 라벨링은 완전히 다른 분야입니다. 인간의 지혜와 전문적인 판단을 요구하는 차별화된 분야입니다. 각각의 고품질 라벨은 고유한 전문 지식, 문화적 배경, 인지적 경험 등을 담고 있으며, 이는 GPU 컴퓨팅 성능처럼 표준화되거나 복제될 수 없습니다.
정확한 암 영상 진단 주석은 선임 종양학자의 전문적인 직관을 필요로 합니다. 숙련된 금융 시장 심리 분석은 월가 트레이더의 실무 경험과 분리될 수 없습니다. 이러한 자연적 희소성과 대체 불가능성은 데이터 주석에 컴퓨팅 파워로는 결코 도달할 수 없는 깊이를 부여합니다.
6월 10일, 메타(Meta)는 데이터 라벨링 기업 스케일 AI(Scale AI)의 지분 49%를 148억 달러에 인수한다고 공식 발표했습니다. 이는 올해 AI 분야 단일 투자로는 최대 규모입니다. 더욱 주목할 만한 점은 스케일 AI의 창립자이자 CEO인 알렉산드르 왕(Alexandr Wang)이 메타의 신설 슈퍼 인텔리전스 연구소 소장을 맡게 된다는 것입니다.
25세의 중국인 기업가인 그는 2016년 스탠퍼드 대학교를 중퇴하고 Scale AI를 설립했습니다. 그가 운영하는 회사의 가치는 현재 300억 달러에 달합니다. Scale AI의 고객 목록은 AI 업계의 올스타 라인업으로, OpenAI, 테슬라, 마이크로소프트, 국방부 등이 장기적인 파트너로 함께하고 있습니다. Scale AI는 AI 모델 학습을 위한 고품질 데이터 주석 서비스를 제공하는 데 특화되어 있으며, 전문적으로 훈련된 주석 작성자 30만 명을 보유하고 있습니다.
아시다시피, 아직도 누구의 모델이 더 높은 점수를 받았는지에 대해 모두가 논쟁을 벌이고 있는 동안, 실제 플레이어들은 조용히 전장의 초점을 데이터 소스로 옮겼습니다.
AI의 미래를 장악하기 위한 비밀 전쟁이 시작됐다.
Scale AI의 성공은 간과되었던 진실을 드러냅니다. 컴퓨팅 파워는 더 이상 부족하지 않고, 모델 아키텍처는 점점 더 동질화되고 있으며, AI 지능의 진정한 한계는 신중하게 조정된 데이터라는 것입니다. Meta가 엄청난 가격을 들여 인수한 것은 아웃소싱 회사가 아니라 AI 시대의 석유 채굴권이었습니다.
모노폴리 이야기에는 항상 반항아가 등장합니다.
클라우드 컴퓨팅 통합 플랫폼이 중앙 집중식 클라우드 컴퓨팅 서비스를 전복하려 하는 것처럼, Sahara AI는 블록체인을 통해 데이터 주석의 가치 분배 규칙을 완전히 재작성하려 합니다. 기존 데이터 주석 모델의 치명적인 결함은 기술적 문제가 아니라 인센티브 설계의 문제입니다.
의사는 몇 시간 동안 의료 이미지에 라벨을 붙이는 데 수십 달러밖에 받지 못하는 반면, 이러한 데이터로 훈련된 AI 모델은 수십억 달러의 가치를 지니지만, 의사는 단 한 푼도 받지 못합니다. 이처럼 극도로 불공평한 가치 분배는 고품질 데이터 제공 의지를 심각하게 저해하고 있습니다.
웹3 토큰 인센티브 메커니즘의 활성화로 이들은 더 이상 값싼 데이터 이주 노동자가 아니라 AI LLM 네트워크의 진정한 주주가 되었습니다. 생산 관계 혁신에 있어 웹3의 이점은 컴퓨팅 파워보다는 데이터 라벨링 시나리오에 더 적합합니다.
흥미롭게도, Sahara AI는 Meta가 엄청난 가격에 인수한 TGE 노드에 우연히 포함되었습니다. 우연일까요, 아니면 치밀한 계획일까요? 제 생각에는 이는 실제로 시장 변곡점을 반영하는 것 같습니다. Web3 AI와 Web2 AI 모두 볼륨 컴퓨팅 파워에서 볼륨 데이터 품질의 교차로로 이동했습니다.
기존의 거대 기업들이 돈을 사용하여 데이터 장벽을 구축하는 반면, Web3는 토큰 경제학을 사용하여 더 큰 데이터 민주화 실험을 구축하고 있습니다.