"계산 낭비"에서 "유용한 계산"으로: Transformer-PoW는 합의 메커니즘을 어떻게 재구성하는가?
원저자: Anastasia Matveeva , Gonka.ai
'낭비'를 통한 합의 도출
비트코인은 놀라운 성과를 달성했습니다. 대규모 실험을 통해 신뢰할 수 없는 낯선 사람들이 은행, 정부 또는 중앙 기관에 의존하지 않고도 협업할 수 있음을 입증했습니다. 사상 처음으로 사람들은 누구의 허락 없이 지구 반대편에 있는 사람들에게 자금을 전송할 수 있게 되었습니다. 네트워크는 중단될 수 없고, 자산은 검열 대상이 아니며, 거래는 진정으로 효과적입니다.
비트코인은 불신하는 참여자들 간의 합의 메커니즘으로 작업 증명(PoW)을 제안합니다. 핵심 논리는 간단하고 명확합니다. 채굴자들은 "퍼즐"을 풀기 위해 경쟁합니다. 즉, 난수(Nonce)를 찾아 블록 데이터와 결합한 후 SHA-256 해시 함수에 입력하여 특정 조건(일반적으로 "앞에 여러 개의 0으로 시작하는 해시 값")을 충족하는 결과를 얻습니다. 예를 들어, 처음 70비트가 이진수 0인 해시 값을 생성하려면 평균 2의 70승 번의 시도가 필요합니다. 다양한 난수를 시도하지 않아도 되는 지름길이나 영리한 알고리즘은 없습니다. 이 과정은 "운 좋은 결과"가 나올 때까지 지속적인 계산을 통해서만 완료될 수 있습니다.
이 메커니즘의 혁명적인 중요성은 블록체인 공격 비용을 크게 증가시킨다는 데 있습니다. 과거 기록을 변경하려면 공격자가 모든 계산 작업을 다시 해야 하기 때문입니다. 또한, 인센티브 일관성을 확보합니다. 채굴자의 보상은 기존 자산에 따라 결정되는 것이 아니라 계산 출력량에 비례합니다(물론 실제로는 자금, 하드웨어, 전기 요금이 여전히 중요한 역할을 합니다). 이는 진정한 탈중앙화 시스템이 대규모로 구현된 최초의 사례입니다.
하지만 이러한 계산 자체에는 내재적 가치가 없다는 단점이 있습니다. 소비되는 전력은 "선행 0의 해시 값"을 계산하는 데만 사용되며 다른 실질적인 용도는 없습니다. 따라서 비트코인은 네트워크 보안을 위해 막대한 계산 낭비를 감수하는 셈입니다. 10년 넘게 이러한 타협은 실제로 "충분히 좋은" 것으로 여겨져 비트코인을 강력한 자산으로 만들었습니다.
탈중앙화의 새로운 시대
현재 인공지능은 급속한 변화를 겪고 있습니다. 대규모 언어 모델(LLM)은 기업과 사용자 모두가 의존하는 인프라, 즉 서비스로 자리 잡고 있습니다. 그러나 현재 대부분의 LLM 추론 작업은 소수의 회사가 관리하는 중앙 서버에서 실행되고 있으며, 이는 다음과 같은 일련의 시급한 문제를 야기합니다.
- 단일 지점 위험 제어: 단일 회사가 사용할 수 있는 모델 유형과 액세스 권한이 있는 사람을 결정합니다.
- 검열 위험: 정부나 기업이 중앙 서비스 제공자에게 서비스를 검열하거나 제한하도록 압력을 가할 수 있습니다.
- 공급업체 종속: 사용자와 개발자는 현재의 "게이트키퍼"에 의존할 수밖에 없습니다.
이것이 바로 비트코인이 원래 해결하고자 했던 핵심적인 문제입니다. 이는 중요한 질문으로 이어집니다. 비트코인의 "자원 낭비"라는 실수를 반복하지 않으면서도 이러한 문제를 해결하는 탈중앙화된 LLM 네트워크를 구축할 수 있을까요?
기존 솔루션과 그 한계
지분 증명(PoS)은 "컴퓨팅 파워를 자본으로 대체"하여 컴퓨팅 리소스 낭비 문제를 해결하려고 시도합니다. 검증자는 특정 수의 토큰을 담보로 잠가야 하며, 블록 검증자로 선택될 확률은 담보 지분의 크기에 비례하며, 에너지 소모는 매우 적습니다.
그러나 이 메커니즘에는 핵심적인 결함이 있습니다. 자본 분배가 본질적으로 불균등하다는 것입니다. 비텐서(Bittensor)와 같은 네트워크를 예로 들면, 상당한 자본을 보유한 검증자는 소액의 토큰 보유자를 끌어들여 지분을 위임하게 하고, 이는 "부자가 더 부자가 된다"는 선순환 구조를 형성합니다. 즉, 자본이 많을수록 더 많은 위임을 받고, 더 많은 보상을 창출하며, 이는 다시 더 많은 위임을 유도합니다. 시간이 지남에 따라 투표권은 초기 자산 보유자에게 집중됩니다. 서브넷이 고성능 GPU와 고품질 추론 기능을 보유하고 있더라도, 검증자의 자본이 제한적이라면 그 영향력은 미미할 것입니다.
결과적으로, 원래 실제 컴퓨팅 파워를 기여한 사람들이 보유했던 투표권은 이제 자본 보유자들이 독점하게 됩니다. 따라서 PoS는 자원 낭비 문제를 해결하지만, 부의 집중이라는 새로운 문제를 야기합니다.
대안
따라서 문제의 핵심은 다음과 같습니다. 작업 증명의 "공정성"을 유지하면서 실제 가치가 있는 작업에 컴퓨팅 리소스를 투입할 수 있을까요?
연구팀은 오랫동안 다양한 접근 방식을 통해 작업 증명(PoW)의 자원 낭비 문제를 해결하려고 시도해 왔습니다. 2017년경, 연구자들은 유용 작업 증명(PoW)을 연구하기 시작했습니다. 이는 여전히 PoW 프레임워크를 기반으로 하지만 채굴자의 계산 작업을 "무작위 해시 퍼즐"에서 잠재적인 경제적 또는 과학적 가치를 지닌 작업으로 전환하는 메커니즘입니다. 일부 방식은 PoW의 "난이도"를 세분화된 문제에 연결하는 반면, 다른 방식은 연합 학습, 행렬 곱셈 작업 또는 영지식 증명 생성을 결합하려고 시도합니다. 이러한 방식의 매력은 명확합니다. 채굴자는 자원 낭비를 줄이면서 "진정으로 유용한 작업"을 완료함으로써 PoW의 공정성을 유지할 수 있습니다.
하지만 최근까지 이러한 시도는 LLM 추론 시나리오를 목표로 하지 않았습니다. 현재 AI 서비스를 지원하는 "실시간 Transformer 추론"보다는 주로 이산 컴퓨팅 문제나 배치 학습에 초점을 맞췄습니다.
실제로 LLM 추론은 "유용한 작업 부하"를 전달하는 이상적인 수단입니다. 높은 계산 비용과 높은 경제적 가치를 지니며, 그 중요성이 날로 커지고 있습니다. 추론 작업의 계산 부하를 네트워크 보안 보장에 활용할 수 있다면 "네트워크 보안과 실제 컴퓨팅 요구" 간의 조화를 이룰 수 있습니다.
간단히 말해, 채굴자는 더 이상 해시 값을 계산할 필요가 없습니다. 대신, 트랜스포머 추론 작업을 완료하여 합의에 참여합니다. 이것이 트랜스포머 기반 작업 증명의 핵심 아이디어입니다. 물론, 이 메커니즘의 설계는 여전히 몇 가지 핵심 과제를 해결해야 합니다.
또한 이 메커니즘은 Transformer에만 국한되지 않으며 향후 더욱 실용적이고 대중적인 모델 아키텍처에도 적용될 수 있다는 점도 주목할 만합니다.
디자인 과제
과제 1: 컴퓨팅 리소스 평가
비트코인에서 "채굴"은 채굴자의 본업입니다. 그러나 사용자에게 서비스를 제공해야 하는 분산형 LLM 네트워크의 경우, 노드는 작업 증명 작업을 수행하는 대신 추론 요청을 처리하는 데 대부분의 시간을 소비합니다. 따라서 두 가지 실행 가능한 옵션이 있습니다.
첫 번째 방법은 이론적으로는 가능하지만 심층적인 연구가 필요합니다. 기존 학습 모델의 실제 추론 연산을 활용하여 참여자의 연산 자원을 추정합니다. 즉, 추론 작업을 실행하고, 연산 비용을 측정하고, 노드 가중치를 보정하는 과정을 거칩니다. 이 접근법은 효율적이지만, 두 가지 중요한 문제를 해결해야 합니다. 첫째, 다양한 입력 데이터의 차이에 어떻게 적응할 것인가이고, 둘째, 악용될 수 있는 학습 모델 구조의 취약점을 어떻게 방지할 것인가입니다. 따라서 상당한 연구개발 투자가 필요합니다.
두 번째로, 더욱 실용적인 시간 제약 방식은 각 작업 증명 퍼즐을 "단기간, 고정 기간, 예측 가능한" 작업(예: 몇 분만 소요)으로 설계하는 것입니다. 네트워크는 전체 에포크 동안 사용 가능한 연산 리소스를 동일하게 유지하도록 합니다. 이러한 설계는 균일한 퍼즐을 구성하는 데 있어 더 큰 유연성을 제공합니다.
과제 2: LLM 계산에 맞춰 작업 조정
"시간 제약이 있는 작업 증명" 방식을 채택하면 새로운 문제가 발생합니다. PoW 작업이 임의적이라면 하드웨어 최적화 방향이 "유용한 작업"에서 벗어날 수 있습니다.
비트코인의 사례는 "인센티브 불일치"의 결과를 보여주었습니다. 시간이 지남에 따라 업계는 해시 값을 계산하는 데만 사용되는 특수 하드웨어(ASIC)를 개발했습니다.
작업 증명(PoW) 기반 Transformer는 이러한 인센티브 논리를 뒤집을 수 있습니다. PoW 작업 자체가 Transformer 추론인 경우 PoW에 대한 하드웨어 최적화는 자연스럽게 서비스 사용자의 추론 성능을 향상시킵니다. 하드웨어 최적화 방향은 자연스럽게 "실제 요구 사항"과 일치하게 됩니다.
이 목표를 달성하려면 두 가지 사항을 보장해야 합니다. 첫째, PoW 작업은 "실제 트랜스포머 추론"이어야 합니다. 둘째, 참가자가 지정된 시간 창 밖에서 미리 답을 계산하지 못하도록 작업은 각 사이클에서 업데이트되어야 합니다.
구체적으로, PoW의 각 라운드는 "무작위로 초기화된 새로운 트랜스포머"를 생성합니다. 참가자들은 과제를 받은 후 정해진 시간 내에 과제를 해결해야 하며, 사전에 분석하거나 계산할 방법이 없습니다. 각 과제는 완전히 새로운 방식으로 진행되므로 실제 추론과 일치하도록 작업의 일관성을 보장합니다. 이러한 설계에서는 지름길이 없으며, 특정 작업을 위한 전용 하드웨어를 개발할 수도 없습니다(작업은 라운드마다 업데이트되기 때문입니다). 하드웨어 개선은 "채굴에 특화된 최적화"를 제공하는 것이 아니라 범용 트랜스포머 추론 성능 향상에만 기여합니다.
과제 3: 보안 보증
마지막으로 핵심 문제는 "난이도 설계"입니다. PoW가 충분히 안전한가요?
비트코인의 보안 논리는 간단하고 명확합니다. 처음 N개의 0으로 해시 값을 생성하려면 엄청난 노력이 필요하고, SHA-256 알고리즘에 대한 알려진 수학적 지름길은 없습니다. 그 "난이도"는 간단하고 검증 가능합니다.
비트코인의 메커니즘도 매우 간단합니다. 난수를 조정하여 해시 값이 "처음 N비트가 0"이라는 조건을 만족하는지 확인합니다.
트랜스포머 시나리오에서 비트코인 작업의 직접 매핑 논리를 이해해 보겠습니다. 비트코인 논스는 "입력 시퀀스"로 변환됩니다. 입력 시퀀스는 벡터 또는 토큰 시퀀스일 수 있으며, 동적으로 조정 가능하고 비트코인 논스와 마찬가지로 양의 정수에서 생성됩니다. "선행 0" 요구 사항은 출력에 대한 제약 조건으로 해석됩니다.
변압기의 출력 벡터는 특정 속성을 충족해야 합니다. 가능한 제약 조건으로는 출력 벡터가 0에 가까울 것, 목표 벡터까지의 거리가 임계값 범위 내에 있을 것, 특정 크기를 가질 것, 또는 기타 명시적으로 정의된 기준을 충족할 것 등이 있습니다. 이러한 조건의 구체적인 정의는 특정 수학적 구조에 대한 지름길을 활용할 수 있기 때문에 매우 중요합니다.
비트코인과의 주요 차이점은 트랜스포머 입력 시퀀스가 기준을 충족하는지 검증하는 데 드는 비용이 높다는 것입니다. 일반 하드웨어는 비트코인 논스에 대해 초당 수백만 개의 해시를 계산할 수 있지만, 트랜스포머 입력을 검증하려면 완전한 순방향 전파 계산이 필요합니다. 참여자는 수십억 개의 후보 시퀀스에 대해 무차별 대입 공격을 시도할 수 없습니다. 추론 속도에 따라 성능이 제한되며, 이것이 바로 우리가 측정해야 할 "연산 작업 부하"입니다.
이 시스템이 비트코인에 필적하는 보안성을 어떻게 달성하는지에 대해서는 추가적인 기술 분석이 필요합니다(다른 글에서 논의할 예정입니다). 핵심 논리는 다음과 같습니다. 트랜스포머를 무작위로 초기화하고 이를 엄격한 문제 설계와 결합하여 "트랜스포머 추론을 완전히 완료해야만 풀 수 있는" 탐색 공간을 구축합니다. 보안성에 대한 완전한 분석은 별도로 제시될 예정입니다.
이 시스템을 비트코인에서 경쟁력 있는 보안 수준으로 만드는 것은 훨씬 더 복잡한 기술적 문제입니다. 이는 또 다른 주제입니다. 핵심 논리는 변환기의 무작위 초기화와 엄격한 문제 설계를 통해 완전한 변환기 추론을 요구하는 탐색 공간을 구성하는 것입니다. 보안에 대한 전체적인 분석은 별도로 논의할 가치가 있습니다.
작업 증명 메커니즘은 15년 동안 꾸준히 실행되어 왔지만, 비트코인의 설계는 상당한 문제도 가져왔습니다. 실용적이지 않은 해시 값을 생성하는 데 엄청난 양의 컴퓨팅 리소스를 소비합니다. PoS와 같은 대안은 리소스 낭비 문제를 해결했지만, 부가 자본 보유자의 손에 집중되는 결과를 낳았습니다.
트랜스포머 기반 작업 증명(PoW)은 또 다른 선택지입니다. PoW의 보안성과 공정성을 유지하면서도 컴퓨팅 리소스를 세상이 진정으로 필요로 하는 곳으로 집중시킵니다. AI 시대의 합의 메커니즘으로서 PoW는 PoW의 보안성을 결합하고, 실제 컴퓨팅 요구 사항을 충족하며, "작업 자체의 실용성"을 제공하여 분산형 AI 네트워크를 위한 완전히 새로운 토대를 마련합니다.
- 核心观点:基于Transformer的PoW可兼顾安全与实用。
- 关键要素:
- 比特币PoW存在巨大计算资源浪费。
- PoS机制导致财富集中新问题。
- Transformer推理可替代哈希计算。
- 市场影响:为去中心化AI网络提供新基础。
- 时效性标注:长期影响


