「計算の無駄」から「有用な計算」へ: Transformer-PoW はコンセンサスメカニズムをどのように作り変えるのでしょうか?
原作者: Anastasia Matveeva 、 Gonka.ai
「無駄」を通して合意形成
ビットコインは驚くべき偉業を成し遂げました。大規模な実証実験を通して、銀行や政府、あるいはいかなる中央集権的な機関にも頼ることなく、信頼関係のない見知らぬ人々が協力できることを実証したのです。初めて、人々は誰の許可も得ずに、地球の反対側にいる人々に資金を送金できるようになりました。ネットワークは停止されることがなく、資産は検閲の対象にならず、取引は真に有効です。
ビットコインは、不信感を持つ参加者間の合意形成メカニズムとして、プルーフ・オブ・ワーク(PoW)を提案しています。そのコアロジックは単純明快です。マイナーは「パズル」を解くために競い合います。つまり、乱数(ノンス)を見つけ、それをブロックデータと組み合わせ、SHA-256ハッシュ関数に入力して、出力が特定の条件(通常は「先頭のゼロで始まるハッシュ値」)を満たすようにします。例えば、最初の70ビットが2進数のゼロであるハッシュ値を生成するには、平均2の70乗回の試行が必要です。異なる乱数を試すことを避けるための近道や巧妙なアルゴリズムは存在しません。このプロセスは、「幸運なヒット」が得られるまで継続的な計算によってのみ完了します。
このメカニズムの革命的な意義は、ブロックチェーンへの攻撃コストが大幅に増加する点にあります。過去の記録を改ざんするには、攻撃者はすべての計算作業をやり直す必要があります。また、インセンティブの一貫性も実現します。マイナーの報酬は、既存の資産ではなく、計算出力に比例します(ただし、実際には資金、ハードウェア、電気代といったコストが依然として影響を及ぼします)。これは、真に分散化されたシステムが大規模に実装された初めての事例です。
しかし、これらの計算自体には本質的な価値がないという代償があります。消費される電力は「先頭のゼロのハッシュ値」を計算するためだけに使用され、それ以外の実用的な用途はありません。したがって、ビットコインは本質的に膨大な計算量の無駄をネットワークセキュリティと引き換えにしているのです。10年以上にわたり、このトレードオフは実際には「十分に良い」ものであり、ビットコインを強力な資産にしています。
分散化の新時代
現在、人工知能は急速な変革の真っ只中にあります。大規模言語モデル(LLM)は、企業とユーザーの両方が頼りにするインフラストラクチャ、つまりサービスになりつつあります。しかしながら、現状ではLLM推論タスクの大部分は、少数の企業が管理する集中型サーバー上で実行されており、いくつかの喫緊の課題が生じています。
- 単一制御ポイントのリスク: 使用できるモデルの種類とアクセス権を持つユーザーを 1 つの企業が決定します。
- 検閲のリスク: 政府や企業が中央集権的なサービスプロバイダーに対して、サービスを検閲または制限するよう圧力をかける可能性があります。
- サプライヤーのロックイン: ユーザーと開発者は、現在の「ゲートキーパー」に頼るしかありません。
これらはまさに、ビットコインが当初解決しようとした根本的な問題点です。そして、重要な疑問が浮かび上がります。ビットコインの「リソースの無駄遣い」という過ちを繰り返さずに、これらの問題を解決する分散型LLMネットワークを構築できるのでしょうか?
既存のソリューションとその限界
プルーフ・オブ・ステーク (PoS) は、「コンピューティング能力を資本に置き換える」ことによってコンピューティング リソースの無駄の問題を解決しようとします。バリデータは一定数のトークンを担保としてロックする必要があり、ブロックを検証するために選択される確率は、担保のステークの大きさに比例しますが、消費するエネルギーはごくわずかです。
しかし、このメカニズムには根本的な欠陥があります。それは、資本の分配が本質的に不均等であるということです。Bittensorのようなネットワークを例に挙げると、潤沢な資本を持つバリデーターは、より小規模なトークン保有者を引き寄せ、ステークを委任させます。「金持ちはさらに金持ちになる」という正のフィードバックループが生まれます。つまり、資本が増えるほど委任が増え、報酬も増え、それがまたさらなる委任を引き寄せるのです。時間の経過とともに、投票権は初期の富裕層に集中します。たとえサブネットが高性能GPUと高品質の推論機能を備えていたとしても、バリデーターの資本が限られていれば、その影響力はごくわずかです。
結果として、本来は実際の計算能力を提供した者が保有していた議決権が、今や資本保有者によって独占されることになります。したがって、PoSは資源の浪費という問題を解決する一方で、富の集中という新たな問題を引き起こします。
代替案
したがって、問題の核心は次のようになります。作業証明の「公平性」を維持しながら、計算リソースを実際の価値のあるタスクに向けることができるでしょうか?
研究チームは長年にわたり、プルーフ・オブ・ワーク(PoW)のリソース浪費問題に様々なアプローチで対処しようと試みてきました。2017年頃、研究者たちはプルーフ・オブ・ユースフル・ワーク(PoW)の研究を始めました。これはPoWフレームワークをベースとしながらも、マイナーの計算タスクを「ランダムハッシュパズル」から潜在的な経済的または科学的価値を持つタスクへと移行させるメカニズムです。PoWの「難易度」を細粒度問題に結び付けるスキームもあれば、連合学習、行列乗算タスク、ゼロ知識証明生成などを組み合わせるスキームもあります。これらのスキームの魅力は明らかです。マイナーは「真に有用な作業」を完了することでPoWの公平性を維持し、リソースの浪費を削減できるからです。
しかし、最近まで、これらの試みは LLM 推論シナリオを対象としたものではなく、現在の AI サービスをサポートする「リアルタイム Transformer 推論」ではなく、離散コンピューティングの問題やバッチ学習に重点が置かれていました。
実際、LLM推論は「有用なワークロード」の理想的な担い手です。計算コストが高く、経済的価値も高く、その重要性は日々高まっています。推論タスクの計算ワークロードをネットワークセキュリティの確保に活用できれば、「ネットワークセキュリティと実際のコンピューティングニーズ」の整合を実現できます。
つまり、マイナーはハッシュ値を計算する必要がなくなり、代わりにTransformer推論タスクを完了することでコンセンサスに参加することになります。これがTransformerベースのProof-of-Workの根底にある考え方です。もちろん、このメカニズムの設計には、依然としていくつかの重要な課題に対処する必要があります。
また、このメカニズムは Transformer に限定されず、将来的にはより実用的かつ主流のモデル アーキテクチャに適応できることにも留意する必要があります。
設計上の課題
課題1: コンピューティングリソースの評価
ビットコインでは、「マイニング」はマイナーのフルタイムの仕事です。しかし、ユーザーにサービスを提供する必要がある分散型LLMネットワークでは、ノードはプルーフ・オブ・ワークのタスクではなく、推論リクエストの処理にほとんどの時間を費やします。そのため、実行可能な選択肢は2つあります。
最初の方法は理論的には実現可能ですが、詳細な研究が必要です。この方法は、既存の学習モデルの実際の推論計算を利用することで、参加者の計算リソースを推定します。具体的には、推論タスクの実行、計算コストの測定、そしてノードの重みのキャリブレーションを行います。このアプローチは効率的ですが、異なる入力データの違いにどのように適応するか、そして悪用される可能性のある学習モデル構造の脆弱性をどのように回避するかという2つの大きな課題に対処する必要があります。そのため、多大な研究開発投資が必要になります。
2つ目の、より実用的な時間制約スキームは、各プルーフ・オブ・ワークパズルを「短時間、固定時間、予測可能な」タスク(例えば、数分しかかからない)として設計し、ネットワークがエポック全体を通して利用可能な計算リソースを維持することを約束するというものです。この設計により、均一なパズルを構築する際の柔軟性が向上します。
課題2: LLM計算とタスクの整合
「時間制約付きプルーフ・オブ・ワーク」アプローチを採用すると、新たな問題が発生します。PoW タスクが任意である場合、ハードウェア最適化の方向が「有用な作業」から逸脱する可能性があります。
ビットコインの事例は「インセンティブの不一致」の結果を示しています。時間の経過とともに、業界ではハッシュ値の計算にのみ使用される専用のハードウェア (ASIC) が開発されました。
Proof-of-Work (PoW) ベースの Transformer は、このインセンティブ ロジックを逆転させることができます。PoW タスク自体が Transformer 推論である場合、PoW のハードウェア最適化によってサービス ユーザーの推論パフォーマンスが自然に向上し、ハードウェア最適化の方向が自然に「実際のニーズ」と一致するようになります。
この目標を達成するには、次の 2 つの点を確保する必要があります。まず、PoW タスクは「実際の Transformer 推論」である必要があります。次に、参加者が指定された時間枠外で事前に答えを計算することを防ぐために、タスクは各サイクルで更新される必要があります。
具体的には、PoWの各ラウンドは「ランダムに初期化された新しいTransformer」を生成します。参加者は課題を受け取った後、それを解くための時間枠が固定されており、事前に分析や事前計算を行うことはできません。各課題は完全に新しいため、作業が現実世界の推論と整合していることが保証されます。この設計では、ショートカットはなく、特定のタスク専用のハードウェアを開発することもできません(タスクはラウンドごとに更新されるため)。ハードウェアの改良は、「マイニング固有の最適化」ではなく、汎用Transformerの推論性能を向上させるだけです。
課題3:セキュリティ保証
最後に、核心となる問題は「難易度の設計」です。PoW は十分に安全でしょうか?
ビットコインのセキュリティ ロジックは単純かつ明確です。最初の N 個のゼロでハッシュ値を生成するには総当たり攻撃が必要であり、SHA-256 アルゴリズムには既知の数学的な近道はありません。その「難しさ」は単純かつ検証可能です。
ビットコインの仕組みも非常にシンプルで、乱数を調整することで、ハッシュ値が「最初の N ビットがゼロ」という条件を満たしているかどうかを検証します。
Transformerシナリオにおけるビットコインタスクの直接マッピングロジックを理解してみましょう。ビットコインのナンスは「入力シーケンス」に変換されます。これはベクトルまたはトークンのシーケンスで、動的に調整可能であり、ビットコインのナンスと同様に正の整数から生成されます。「先頭のゼロ」の要件は、出力に対する制約に変換されます。
Transformerの出力ベクトルは、特定の特性を満たす必要があります。制約としては、出力ベクトルがゼロに近いこと、ターゲットベクトルとの距離が閾値範囲内であること、特定の大きさを持つこと、あるいは明示的に定義された他の基準を満たすことなどが挙げられます。特定の数学的構造においては、近道が利用できる可能性があるため、この条件の具体的な定義は非常に重要です。
Bitcoinとの重要な違いは、Transformerの入力シーケンスが基準を満たしているかどうかを検証するコストが高いことです。一般的なハードウェアはBitcoin Nonceに対して毎秒数百万回のハッシュ計算を実行できますが、Transformerの入力を検証するには完全な順方向伝播計算が必要です。参加者は数十億もの候補シーケンスを総当たりで試すことはできません。彼らの能力は推論速度によって制限されるからです。そして、まさにこれが私たちが測定する必要がある「計算ワークロード」なのです。
このシステムがビットコインに匹敵するセキュリティをどのように実現しているかについては、更なる技術的分析が必要です(これについては別の記事で説明します)。その中核となるロジックは、Transformerをランダムに初期化し、これを厳密な問題設計と組み合わせることで、「Transformerの完全な推論を完了することによってのみ解ける」探索空間を構築するというものです。セキュリティの完全な分析については、別途発表します。
このシステムをビットコイン上で競争的に安全にするのは、より複雑な技術的な話であり、それは別の話題です。コアとなるロジックは、Transformerのランダムな初期化と厳密な問題設計を通じて、Transformerの完全な推論を必要とする探索空間を構築することです。そのセキュリティの完全な分析については、別途議論する価値があります。
プルーフ・オブ・ワークのメカニズムは15年間安定して稼働してきましたが、ビットコインの設計は重大な問題ももたらしました。実用性のないハッシュ値を生成するために膨大な計算リソースを消費します。PoSなどの代替手段はリソースの浪費の問題を解決しましたが、資本保有者の手に富が集中する結果となりました。
TransformerをベースとしたProof-of-Work(PoW)は、もう一つの選択肢です。PoWのセキュリティと公平性を維持しながら、計算リソースを世界が真に必要とする場所に配分します。AI時代のコンセンサスメカニズムとして、PoWのセキュリティ、現実世界の計算ニーズへの対応、そして「作業そのものの実用性」を兼ね備え、分散型AIネットワークの全く新しい基盤を築きます。
- 核心观点:基于Transformer的PoW可兼顾安全与实用。
- 关键要素:
- 比特币PoW存在巨大计算资源浪费。
- PoS机制导致财富集中新问题。
- Transformer推理可替代哈希计算。
- 市场影响:为去中心化AI网络提供新基础。
- 时效性标注:长期影响


