왜 Web3 AI에서는 다중 모드 모듈화가 환상일까요?

特邀专栏作者

2025-06-18 12:44

이 기사는 약 6448자로, 전체를 읽는 데 약 10분이 소요됩니다

Web3 AI의 미래는 모방이 아니라 전략적 우회로에 있습니다. 고차원 공간에서의 의미적 정렬, 주의 메커니즘의 정보 병목 현상, 그리고 이기종 컴퓨팅 성능 하의 특징 정렬에 이르기까지, Web3 AI가 농촌에서 도시로의 접근 방식을 전략적 프로그램으로 삼아야 하는 이유를 설명하겠습니다.

Movemaker의 연구원 @BlazingKevin_의 원본 기사

엔비디아는 딥식(Deepseek)으로 인한 손실을 조용히 만회하고, 심지어 새로운 최고치를 경신했습니다. 멀티모달 모델의 진화는 혼란을 초래한 것이 아니라, Web2 AI의 기술적 장벽을 심화시켰습니다. 의미 정렬에서 시각적 이해, 고차원 임베딩에서 피처 융합에 이르기까지, 복잡한 모델은 전례 없는 속도로 다양한 모달 표현을 통합하여 점점 더 폐쇄적인 AI 고지를 구축하고 있습니다. 미국 주식 시장 또한 과열 양상을 보였습니다. 통화 주식이든 AI 주식이든 모두 강세장을 경험했습니다. 그러나 이러한 열기는 암호화폐와는 아무런 관련이 없습니다. 우리가 목격한 Web3 AI 시도, 특히 최근 몇 달 동안 에이전트(Agent)의 진화는 거의 완전히 잘못된 방향으로 나아가고 있습니다. 분산형 구조를 사용하여 Web2 스타일의 멀티모달 모듈러 시스템을 구축하려는 희망적 사고는 사실상 기술과 사고의 이중적인 전위입니다. 모듈 결합이 극도로 강하고, 피처 분포가 매우 불안정하며, 컴퓨팅 파워 요구 사항이 점점 더 집중되는 오늘날의 세계에서 멀티모달 모듈화는 Web3에서 전혀 성립할 수 없습니다. 우리가 지적하고자 하는 것은 Web3 AI의 미래가 모방이 아니라 전략적 우회로라는 것입니다. 고차원 공간에서의 의미적 정렬, 주의 메커니즘의 정보 병목 현상, 그리고 이기종 컴퓨팅 파워 하의 특징 정렬에 이르기까지, Web3 AI가 왜 농촌 지역을 전략적 프로그램으로 삼아야 하는지 설명하겠습니다.

Web3 AI는 평면적 멀티모달 모델을 기반으로 하기 때문에 의미론을 정렬할 수 없어 성능이 저하됩니다.

현대 Web2 AI의 멀티모달 시스템에서 "의미 정렬"은 이미지, 텍스트, 오디오, 비디오 등 다양한 모달리티의 정보를 동일하거나 상호 변환 가능한 의미 공간으로 매핑하여 모델이 원래 서로 다른 신호에 내재된 의미를 이해하고 비교할 수 있도록 하는 것을 의미합니다. 예를 들어, 고양이 사진과 "귀여운 고양이"라는 문장을 고차원 임베딩 공간에서 서로 가까운 위치에 투사해야 합니다. 그래야 검색, 생성 또는 추론 시 "그림을 보고 말하고", "소리를 듣고 그림을 연관시킬" 수 있습니다.

고차원 임베딩 공간이 확보되어야만 워크플로를 여러 모듈로 나누어 비용을 절감하고 효율성을 높일 수 있습니다. 그러나 Web3 Agent 프로토콜에서는 모듈성이 Web3 AI의 허상이기 때문에 고차원 임베딩을 구현할 수 없습니다.

고차원 임베딩 공간을 어떻게 이해해야 할까요? 가장 직관적인 관점에서 "고차원 임베딩 공간"을 좌표계라고 생각해 보세요. 평면의 x-y 좌표처럼, 한 쌍의 숫자를 사용하여 점을 찾을 수 있습니다. 일반적인 2차원 평면에서 점은 두 개의 숫자(x, y)로 완전히 결정되는 반면, "고차원" 공간에서는 각 점이 128, 512, 심지어 수천 개의 숫자로 표현됩니다.

가장 간단한 것부터 가장 복잡한 것까지 세 단계로 이해해보세요.

2D 예:
베이징(116.4, 39.9), 상하이(121.5, 31.2), 광저우(113.3, 23.1)와 같이 지도에 여러 도시의 좌표를 표시했다고 가정해 보겠습니다. 각 도시는 "2차원 임베딩 벡터"에 해당합니다. 2차원 좌표는 지리적 위치 정보를 숫자로 인코딩합니다.
도시 간의 "유사성"을 측정하고 싶다면(지도 상에서 가까이 있는 도시는 일반적으로 동일한 경제권이나 기후권에 속하는 경향이 있음), 좌표 간의 유클리드 거리를 비교하면 됩니다.
여러 차원으로 확장:
이제 "지리적 공간"에서의 위치뿐만 아니라 "기후적 특징"(평균 기온, 강우량), "인구 통계적 특징"(인구 밀도, GDP) 등도 설명하고 싶다고 가정해 보겠습니다. 각 도시에 5차원, 10차원 또는 그 이상의 차원을 포함하는 벡터를 할당할 수 있습니다.
예를 들어, 광저우의 5차원 벡터는 [113.3, 23.1, 24.5, 1700, 14.5]일 수 있으며, 이는 각각 경도, 위도, 평균 기온, 연 강수량(mm), 경제 지수를 나타냅니다. 이러한 "다차원 공간"을 통해 도시들을 지리, 기후, 경제 및 기타 차원으로 동시에 비교할 수 있습니다. 두 도시의 벡터가 매우 가깝다면 이러한 속성들이 매우 유사하다는 것을 의미합니다.
의미론으로 전환 - "embed"의 이유:
자연어 처리(NLP)나 컴퓨터 비전 분야에서는 "단어", "문장" 또는 "이미지"를 이러한 다차원 벡터로 매핑하여 단어나 이미지의 "유사한 의미"가 공간적으로 더 가깝게 배치되도록 하고자 합니다. 이러한 매핑 과정을 "임베딩"이라고 합니다.
예를 들어, "고양이"를 300차원 벡터 v₁에, "개"를 다른 벡터 v₂에, "경제"와 같은 "관련 없는" 단어를 v₃에 매핑하는 모델을 학습합니다. 그러면 이 300차원 공간에서 v₁과 v₂ 사이의 거리는 작아지고(두 단어 모두 동물이고 유사한 언어 환경에 자주 등장하기 때문), v₁과 v₃ 사이의 거리는 커집니다.
이 모델은 방대한 양의 텍스트 또는 이미지-텍스트 쌍으로 학습되므로, 학습하는 각 차원은 "경도"와 "위도"와 같은 해석 가능한 속성에 직접적으로 대응하지 않고, 일종의 "암묵적 의미적 특징"에 대응합니다. 어떤 차원은 "동물 대 비동물"이라는 대략적인 구분을 포착하고, 어떤 차원은 "가축 대 야생"을 구분하며, 어떤 차원은 "귀엽다 대 강하다"라는 느낌에 대응할 수 있습니다. 간단히 말해, 수백 또는 수천 개의 차원이 함께 작용하여 온갖 종류의 복잡하고 얽힌 의미적 수준을 인코딩합니다.

고차원성과 저차원성의 차이점은 무엇일까요? 충분한 차원이 있어야만 서로 얽힌 다양한 의미적 특징을 수용할 수 있으며, 고차원만이 각 의미적 차원에서 더 명확한 위치를 확보할 수 있습니다. 의미를 구분할 수 없는 경우, 즉 의미를 정렬할 수 없는 경우, 저차원 공간의 서로 다른 신호들이 서로 "압박"되어 검색이나 분류 시 모델이 자주 혼동되고 정확도가 크게 떨어집니다. 둘째, 전략 생성 단계에서 미묘한 차이를 포착하기 어렵고, 주요 거래 신호를 놓치거나 위험 임계값을 잘못 판단하기 쉬워 수익률에 직접적인 영향을 미칩니다. 셋째, 모듈 간 협업이 불가능해지고, 각 에이전트가 독립적으로 행동하며, 정보 섬 현상이 심각해지고, 전반적인 응답 지연이 증가하고, 견고성이 저하됩니다. 마지막으로, 복잡한 시장 시나리오에서 저차원 구조는 다중 소스 데이터를 수용할 수 있는 용량이 거의 없으며, 시스템 안정성과 확장성을 보장하기 어렵습니다. 장기적으로 운영하면 성능 병목 현상과 유지 관리의 어려움에 빠지기 마련이며, 결국 제품 성능이 출시 직후 기대에 미치지 못하게 됩니다.

그렇다면 Web3 AI 또는 에이전트 프로토콜은 고차원 임베딩 공간을 구현할 수 있을까요? 우선, 고차원 공간은 어떻게 구현될까요? 전통적인 의미에서 "고차원"은 시장 정보, 전략 수립, 실행 및 구현, 위험 관리와 같은 각 하위 시스템이 데이터 표현 및 의사 결정 과정에서 서로 정렬되고 보완되어야 합니다. 그러나 대부분의 Web3 에이전트는 기존 API(CoinGecko, DEX 인터페이스 등)를 단순히 독립적인 "에이전트"로 캡슐화할 뿐이며, 통합된 중앙 임베딩 공간과 모듈 간 어텐션 메커니즘이 부족하여 정보가 여러 각도와 수준에서 모듈 간에 상호 작용할 수 없습니다. 단일 기능을 보여주는 선형 파이프라인만 따라갈 수 있으며, 전체적인 폐루프 최적화를 형성할 수 없습니다.

많은 에이전트가 외부 인터페이스를 직접 호출하고, 인터페이스에서 반환된 데이터에 대한 미세 조정이나 기능 엔지니어링조차 충분히 수행하지 않습니다. 예를 들어, 시장 분석 에이전트는 단순히 가격과 거래량만 얻고, 거래 실행 에이전트는 인터페이스 매개변수에 따라 주문을 내며, 위험 관리 에이전트는 여러 임계값에 따라 경보를 발령합니다. 각 에이전트는 고유한 기능을 수행하지만, 다중 모드 융합 및 동일한 위험 이벤트나 시장 신호에 대한 심층적인 의미론적 이해가 부족하여 극단적인 시장 상황이나 교차 자산 기회에 직면했을 때 시스템이 포괄적이고 다각적인 전략을 신속하게 생성할 수 없습니다.

따라서 Web3 AI가 고차원 공간을 구현하도록 요구하는 것은 에이전트 프로토콜이 관련된 모든 API 인터페이스를 자체적으로 개발하도록 요구하는 것과 같으며, 이는 모듈화라는 본래의 의도에 위배됩니다. Web3 AI에서 중소기업들이 설명하는 모듈형 멀티모달 시스템은 면밀한 검토를 통과할 수 없습니다. 고차원 아키텍처는 신호 수집부터 전략 계산, 실행 및 위험 제어에 이르기까지 모든 링크가 동일한 표현 및 손실 함수 세트를 공유하도록 하는 엔드투엔드 통합 학습 또는 협업 최적화를 요구합니다. Web3 에이전트의 "플러그인으로서의 모듈"이라는 개념은 단편화를 심화시켰습니다. 각 에이전트 업그레이드, 배포 및 매개변수 조정은 자체 사일로에서 수행되어 동기식 반복이 어렵고, 효과적인 중앙 집중식 모니터링 및 피드백 메커니즘이 부재하여 유지 관리 비용이 급증하고 전반적인 성능이 제한됩니다.

업계 장벽을 뛰어넘는 완전 연계 지능형 에이전트를 구현하려면 엔드투엔드 공동 모델링, 모듈 간 통합 임베딩, 그리고 협업적 훈련 및 배포라는 시스템 엔지니어링의 한계를 극복해야 합니다. 그러나 현재 시장에는 그러한 어려움이 존재하지 않으며, 당연히 시장 수요도 없습니다.

저차원 공간에서는 주의 메커니즘을 정밀하게 설계할 수 없습니다.

고수준 멀티모달 모델은 정교한 어텐션 메커니즘을 필요로 합니다. 어텐션 메커니즘은 본질적으로 컴퓨팅 리소스를 동적으로 할당하여 모델이 특정 입력 양식을 처리할 때 가장 관련성 있는 부분에 선택적으로 "집중"할 수 있도록 하는 방식입니다. 가장 일반적인 메커니즘은 트랜스포머의 셀프 어텐션과 교차 어텐션 메커니즘입니다. 셀프 어텐션은 모델이 시퀀스의 각 요소 간의 종속성(예: 텍스트 내 각 단어가 다른 단어에 미치는 중요성)을 측정할 수 있도록 합니다. 교차 어텐션은 한 양식(예: 텍스트)의 정보를 바탕으로 다른 양식(예: 이미지의 특징 시퀀스)을 디코딩하거나 생성할 때 어떤 이미지 특징을 "살펴볼"지 결정할 수 있도록 합니다. 멀티헤드 어텐션을 통해 모델은 서로 다른 부분 공간에서 여러 정렬을 동시에 학습하여 더욱 복잡하고 세밀한 연관성을 포착할 수 있습니다.

어텐션 메커니즘이 작동하기 위한 전제는 다중 모달리티가 고차원을 가진다는 것입니다. 고차원 공간에서 정교한 어텐션 메커니즘은 방대한 고차원 공간에서 가장 핵심적인 부분을 최단 시간 내에 찾아낼 수 있습니다. 어텐션 메커니즘이 작동하기 위해 고차원 공간에 배치되어야 하는 이유를 설명하기 전에, 어텐션 메커니즘을 설계할 때 트랜스포머 디코더가 표현하는 Web2 AI의 프로세스를 먼저 이해해 보겠습니다. 핵심 아이디어는 시퀀스(텍스트, 이미지 패치, 오디오 프레임)를 처리할 때 모델이 각 요소에 "어텐션 가중치"를 동적으로 할당하여 맹목적으로 동등하게 처리하는 대신 가장 관련성 높은 정보에 집중할 수 있도록 한다는 것입니다.

간단히 말해, 어텐션 메커니즘을 자동차에 비유한다면, 쿼리-키-값(Query-Key-Value)을 설계하는 것은 엔진을 설계하는 것과 같습니다. QKV는 핵심 정보를 파악하는 데 도움이 되는 메커니즘입니다. 쿼리는 쿼리("내가 무엇을 찾고 있는가")를, 키는 인덱스("내가 어떤 태그를 가지고 있는가")를, 값은 콘텐츠("여기에 어떤 콘텐츠가 있는가")를 나타냅니다. 멀티모달 모델의 경우, 모델에 입력하는 콘텐츠는 문장, 그림 또는 오디오 클립일 수 있습니다. 차원 공간에서 필요한 콘텐츠를 검색하기 위해 이러한 입력은 문자, 특정 픽셀 크기의 작은 블록 또는 오디오 프레임과 같은 가장 작은 단위로 나뉩니다. 멀티모달 모델은 이러한 가장 작은 단위에 대한 쿼리, 키, 값을 생성하여 어텐션 계산을 수행합니다. 모델은 특정 위치를 처리할 때, 해당 위치의 쿼리를 사용하여 모든 위치의 키를 비교하여 현재 요구 사항에 가장 잘 맞는 태그를 결정합니다. 그런 다음, 일치 정도에 따라 해당 위치에서 값을 추출하고 중요도에 따라 가중치를 적용합니다. 마지막으로, 자체 정보와 전 세계적으로 관련성 있는 콘텐츠를 모두 포함하는 새로운 표현이 생성됩니다. 이러한 방식으로 각 출력은 맥락에 따라 동적으로 "질문-검색-통합"되어 효율적이고 정확한 정보 집중을 달성할 수 있습니다.

이 엔진을 기반으로 "전역 상호작용"과 "제어 가능한 복잡성"을 교묘하게 결합하기 위해 다양한 부분이 추가되었습니다. 수치적 안정성을 보장하기 위한 점곱 확장, 표현력을 강화하기 위한 다중 헤드 병렬 처리, 시퀀스 순서를 유지하기 위한 위치 인코딩, 효율성의 균형을 맞추기 위한 희소 변이체, 학습 안정성을 위한 잔차 및 정규화, 그리고 다중 모달리티를 가능하게 하는 교차 주의가 여기에 포함됩니다. 이러한 모듈화되고 진보적인 설계를 통해 Web2 AI는 다양한 시퀀스 및 다중 모달 작업을 처리할 때 저렴한 컴퓨팅 성능 범위 내에서 강력한 학습 기능과 효율적인 운영을 모두 제공할 수 있습니다.

모듈형 Web3 AI가 통합 어텐션 스케줄링을 달성할 수 없는 이유는 무엇일까요? 첫째, 어텐션 메커니즘은 통합된 쿼리-키-값 공간에 의존합니다. 모든 입력 피처는 내적을 통해 동적 가중치를 계산하기 위해 동일한 고차원 벡터 공간에 매핑되어야 합니다. 독립 API는 통합 임베딩 계층 없이 가격, 주문 상태, 임계값 알람 등 다양한 형식과 분포의 데이터를 반환하며, 상호작용하는 Q/K/V 집합을 형성할 수 없습니다. 둘째, 멀티 헤드 어텐션은 동일한 계층에서 여러 정보 소스에 병렬로 어텐션을 적용하고 그 결과를 집계하는 반면, 독립 API는 종종 "먼저 A를 호출하고, 그 다음 B를 호출하고, 그 다음 C를 호출하는" 방식으로 각 단계의 출력은 다음 모듈의 입력일 뿐입니다. 병렬 및 다중 방향 동적 가중치 부여 기능이 부족하며, 모든 위치 또는 모든 모달리티를 동시에 평가하고 통합하는 어텐션 메커니즘의 정교한 스케줄링을 자연스럽게 시뮬레이션할 수 없습니다. 마지막으로, 실제 어텐션 메커니즘은 전체 맥락을 기반으로 각 요소에 동적으로 가중치를 할당합니다. API 모드에서는 모듈은 호출될 때만 "독립적인" 컨텍스트를 볼 수 있으며, 서로 간에 실시간으로 공유되는 중앙 컨텍스트가 없으므로 모듈 간에 전역적인 연관과 포커스를 구현하는 것이 불가능합니다.

따라서 공통 벡터 표현, 병렬 가중치 및 집계 없이 다양한 기능을 개별 API로 캡슐화하는 것만으로는 Transformer와 같은 "통합된 주의 스케줄링" 기능을 구축하는 것이 불가능합니다. 이는 엔진 성능이 낮은 자동차가 어떻게 수정하더라도 상한선을 개선할 수 없는 것과 같습니다.

개별 모듈형 패치워크의 결과, 피처 융합은 표면 정적 스플라이싱 수준에 머무릅니다.

"특징 융합"은 정렬 및 어텐션을 기반으로 다양한 모달리티를 처리한 후 얻은 특징 벡터를 더욱 결합하여 분류, 검색, 생성 등의 후속 작업에 직접 사용할 수 있도록 하는 것입니다. 융합 방법은 스플라이싱 및 가중 합처럼 간단할 수도 있고, 쌍선형 풀링, 텐서 분해, 심지어 동적 라우팅 기술처럼 복잡할 수도 있습니다. 고차 방법은 다층 네트워크에서 정렬, 어텐션, 융합을 번갈아 사용하거나, 그래프 신경망(GNN)을 통해 교차 모달 특징 간에 더욱 유연한 메시지 전달 경로를 구축하여 심층적인 정보 상호작용을 달성하는 것입니다.

말할 필요도 없이, Web3 AI는 아직 가장 단순한 스플라이싱 단계에 있습니다. 동적 특징 융합의 전제는 고차원 공간과 정확한 어텐션 메커니즘이기 때문입니다. 이러한 전제 조건이 충족되지 않으면 최종 단계의 특징 융합은 우수한 성능을 달성할 수 없습니다.

Web2 AI는 종단간 공동 학습(end-to-end joint training)을 채택하는 경향이 있습니다. 이미지, 텍스트, 오디오와 같은 모든 모달 특징을 동일한 고차원 공간에서 동시에 처리하고, 어텐션 계층과 퓨전 계층을 통해 하위 작업 계층과 협력하여 최적화합니다. 모델은 순방향 및 역방향 전파에서 최적의 퓨전 가중치와 상호작용 방식을 자동으로 학습합니다. 반면, Web3 AI는 더욱 개별적인 모듈 스플라이싱 방식을 채택하여 이미지 인식, 시장 탐색, 위험 평가와 같은 다양한 API를 독립적인 에이전트로 캡슐화한 후, 각 에이전트에서 출력되는 레이블, 값 또는 임계값 알람을 간단히 조합합니다. 종합적인 결정은 메인 라인 로직이나 수작업을 통해 이루어집니다. 이러한 방식은 통합된 학습 목표와 모듈 간 그래디언트 흐름이 부족합니다.

Web2 AI에서 시스템은 어텐션 메커니즘을 사용하여 맥락에 따라 다양한 특징의 중요도 점수를 실시간으로 계산하고 융합 전략을 동적으로 조정합니다. 멀티헤드 어텐션은 또한 동일 레벨에서 여러 개의 서로 다른 특징 상호작용 모드를 병렬로 포착하여 로컬 세부 정보와 글로벌 의미론을 고려할 수 있습니다. Web3 AI는 종종 "이미지 × 0.5 + 텍스트 × 0.3 + 가격 × 0.2"와 같은 가중치를 미리 고정하거나, 간단한 if/else 규칙을 사용하여 병합 여부를 결정하거나, 각 모듈의 출력만 함께 제시하는 방식으로 병합을 전혀 실행하지 않습니다. 이는 유연성이 부족합니다.

Web2 AI는 모든 모달 피처를 수천 차원의 고차원 공간에 매핑합니다. 융합 과정은 벡터 연결뿐만 아니라 덧셈 및 쌍선형 풀링과 같은 여러 고차 상호작용 연산을 포함합니다. 각 차원은 특정 잠재적 의미론에 대응할 수 있으며, 이를 통해 모델은 심층적이고 복잡한 모달 간 연관성을 포착할 수 있습니다. 반면, Web3 AI의 각 에이전트 출력은 피처 차원이 매우 낮은 몇 개의 핵심 필드나 지표만 포함하는 경우가 많으며, "이미지 콘텐츠가 텍스트 의미와 일치하는 이유" 또는 "가격 변동과 감정 트렌드 간의 미묘한 연관성"과 같은 섬세한 정보를 표현하는 것은 거의 불가능합니다.

Web2 AI에서는 다운스트림 작업의 손실이 어텐션 계층과 퓨전 계층을 통해 모델의 여러 부분으로 지속적으로 전달되어 어떤 특징을 강화하거나 억제해야 할지 자동으로 조정함으로써 폐쇄 루프 최적화를 형성합니다. 이와 달리 Web3 AI는 API 호출 결과를 보고한 후 매개변수를 평가하고 조정하기 위해 수동 또는 외부 프로세스에 의존합니다. 자동화된 엔드투엔드 피드백이 부족하여 퓨전 전략을 온라인에서 반복하고 최적화하는 것이 어렵습니다.

AI 산업 장벽 심화되고 있지만, 아직은 문제점이 드러나지 않아

엔드투엔드 학습에서 크로스 모달 정렬, 정밀한 어텐션 계산, 그리고 고차원 특징 융합을 고려해야 하기 때문에 Web2 AI의 멀티모달 시스템은 종종 매우 큰 규모의 엔지니어링 프로젝트입니다. 방대하고 다양하며 정밀하게 주석 처리된 크로스 모달 데이터 세트가 필요할 뿐만 아니라, 몇 주 또는 몇 달에 달하는 학습 시간을 위해 수천 개의 GPU가 필요합니다. 모델 아키텍처 측면에서는 다양한 최신 네트워크 설계 개념과 최적화 기술을 통합합니다. 엔지니어링 구현 측면에서는 확장 가능한 분산 학습 플랫폼, 모니터링 시스템, 모델 버전 관리 및 배포 파이프라인을 구축해야 합니다. 알고리즘 개발 측면에서는 더욱 효율적인 어텐션 변형, 더욱 견고한 정렬 손실, 그리고 더욱 가벼운 융합 전략에 대한 지속적인 연구가 필요합니다. 이러한 풀 링크, 풀 스택 체계적인 작업은 자금, 데이터, 컴퓨팅 파워, 인재, 심지어 조직 협업까지 매우 높은 요구 조건을 요구하기 때문에 매우 강력한 산업 장벽을 형성하며, 소수의 선도적인 팀만이 현재까지 구축한 핵심 경쟁력을 구축합니다.

4월에 중국 AI 애플리케이션을 검토하고 WEB3 AI와 비교했을 때 한 가지 중요한 점을 언급했습니다. 암호화폐는 장벽이 높은 산업에서 돌파구를 마련할 잠재력이 있다는 것입니다. 즉, 일부 산업은 기존 시장에서 이미 매우 성숙했지만, 동시에 심각한 문제점을 안고 있다는 것을 의미합니다. 성숙도가 높다는 것은 유사한 비즈니스 모델에 익숙한 사용자가 충분하다는 것을 의미하며, 심각한 문제점은 사용자가 새로운 솔루션을 시도할 의향이 있다는 것을 의미합니다. 즉, 암호화폐를 수용하려는 강한 의지가 있다는 것을 의미합니다. 두 가지 모두 필수적입니다. 다시 말해, 기존 시장에서 이미 매우 성숙했지만 심각한 문제점을 안고 있는 산업이 아니라면, 암호화폐는 그 안에 뿌리내릴 수 없고 자리 잡을 수 없습니다. 사용자는 암호화폐를 완전히 이해하기를 매우 꺼리고, 그 잠재력의 상한선을 이해하지 못합니다.

PMF 기반의 WEB3 AI 또는 모든 암호화 제품은 시골에서 도시를 포위하는 전략을 기반으로 개발되어야 합니다. 핵심 시나리오, 즉 목표 도시의 출현을 기다리기 전에, 엣지에서 소규모로 테스트하여 탄탄한 기반을 확보해야 합니다. Web3 AI의 핵심은 탈중앙화에 있으며, 그 진화 과정은 높은 병렬성, 낮은 결합도, 그리고 이기종 컴퓨팅 성능의 호환성에 반영됩니다.** 이러한 특징으로 인해 Web3 AI는 엣지 컴퓨팅과 같은 시나리오에서 더욱 유리하며, LoRA 미세 조정, 행동 정렬 후 학습 작업, 크라우드소싱 데이터 학습 및 어노테이션, 소규모 기본 모델 학습, 엣지 장치 협업 학습과 같은 경량 구조, 쉬운 병렬화, 그리고 인센티브를 부여할 수 있는 작업에 적합합니다. 이러한 시나리오의 제품 아키텍처는 가벼우며 로드맵을 유연하게 반복할 수 있습니다. 하지만 WEB2 AI의 장벽이 막 형성되기 시작했기 때문에 지금이 기회라는 의미는 아닙니다. Deepseek의 등장은 다중 모드 복합 작업 AI의 발전을 촉진했습니다. 이는 선도 기업들의 경쟁이자 WEB2 AI 배당금의 등장 초기 단계입니다. WEB2 AI의 배당금이 사라지고 난 후에야 비로소 남은 페인 포인트들이 WEB3 AI가 끼어들 수 있는 기회가 될 것이라고 생각합니다. 마치 DeFi의 탄생처럼 말입니다. 그 시점이 오기 전에 WEB3 AI가 스스로 만들어낸 페인 포인트들이 시장에 계속 유입될 것입니다. "도시를 시골에서 포위하는" 프로토콜을 신중하게 파악하고, 외곽에서 진입할지, 먼저 강점이 약하고 시장 기반 시나리오가 부족한 시골(또는 소규모 시장, 소규모 신)에서 발판을 마련할지, 그리고 점진적으로 자원과 경험을 축적할지, 점과 면을 결합하고 순환적으로 홍보할지, 그리고 충분히 작은 적용 시나리오에서 제품을 지속적으로 반복하고 업데이트할 수 있을지를 고려해야 합니다. 이것이 불가능하다면, 이러한 기반 위에 PMF를 구축하여 10억 달러의 시장 가치를 달성하는 것은 어려울 것이며, 이러한 프로젝트들은 고려 대상에서 제외될 것입니다. 장기전에도 대처할 수 있고, 유연하고 기동성이 뛰어난지 여부와 관계없이, WEB2 AI의 잠재적 장벽은 역동적으로 변화하고 있으며, 그에 따라 잠재적인 문제점 또한 진화하고 있습니다. WEB3 AI 프로토콜이 다양한 시나리오에 적응하고, 농촌 지역 간 이동을 빠르게 하며, 목표 도시에 가장 빠른 속도로 접근할 수 있을 만큼 유연해야 하는지에 주의를 기울여야 합니다. 프로토콜 자체가 인프라 집약적이고 네트워크 아키텍처가 거대하다면, 폐기될 가능성이 매우 높습니다.

Movemaker 소개

무브메이커는 앱토스 재단(Aptos Foundation)의 공식 인증을 받은 최초의 커뮤니티 단체로, 안카(Ankaa)와 블록부스터(BlockBooster)가 공동으로 설립하여 앱토스 중국 생태계의 구축 및 발전을 촉진하는 데 주력하고 있습니다. 중국 지역 앱토스의 공식 대표 기관으로서, 무브메이커는 개발자, 사용자, 자본 및 다양한 생태계 파트너를 연결하여 다양하고 개방적이며 번영하는 앱토스 생태계를 구축하는 데 전념하고 있습니다.

부인 성명:

이 기사/블로그는 정보 제공 목적으로만 제공되며 저자의 개인적인 의견을 나타내며 반드시 Movemaker의 입장을 대표하는 것은 아닙니다. 이 기사는 다음을 제공하기 위한 것이 아닙니다. (i) 투자 조언 또는 투자 권장 사항; (ii) 디지털 자산 매수, 매도 또는 보유에 대한 제안 또는 권유; (iii) 재무, 회계, 법률 또는 세무 조언. 스테이블코인 및 NFT를 포함한 디지털 자산을 보유하는 것은 매우 위험하며 가격이 변동하여 가치가 없어질 수 있습니다. 재정 상황에 따라 디지털 자산을 거래하거나 보유하는 것이 적절한지 신중하게 고려해야 합니다. 특정 상황에 대해 궁금한 사항이 있는 경우 법률, 세무 또는 투자 고문에게 문의하십시오. 이 기사에 제공된 정보(시장 데이터 및 통계 정보 포함, 있는 경우)는 일반적인 정보 제공만을 목적으로 합니다. 이러한 데이터와 차트를 준비하는 데 합리적인 주의를 기울였지만, 여기에 표현된 사실적 오류나 누락에 대해 책임을 지지 않습니다.

투자하다

산업

Aptos

기술

Odaily 공식 커뮤니티에 가입하세요

구독 그룹