DWFレポート:DeFi収益最適化においてAIが人間を上回るが、自律取引では5倍遅れ
- 核心的な視点:DeFiにおけるAIエージェントの自動化活動の割合はすでに約20%に達しており、収益最適化などルールが明確なシナリオでは人間を上回るパフォーマンスを示している。しかし、複雑な意思決定を必要とする取引分野では、トップクラスの人間トレーダーのパフォーマンスが依然としてトップクラスのAIエージェントを大きく上回っている。
- 重要な要素:
- 活動規模:自動化/エージェント活動は全オンチェーン活動の19%以上を占めると推定され、そのうちステーブルコイン送金量の76%以上がボットによって生成されている。
- 収益最適化の優位性:流動性提供などのシナリオにおいて、Giza TechのARMAアプリケーションのように、USDCに対して9.75%を超える年率リターンを生み出し、一般的なレンディングプロトコルよりも優れたパフォーマンスを示している。
- 取引分野での遅れ:人間とエージェントの取引競争において、トップクラスの人間のパフォーマンスはトップクラスのエージェントを5倍以上上回っており、複雑な取引において人間が依然として主導権を握っていることを示している。
- モデルパフォーマンスの差異:エージェント取引競争は、モデル選択(例:Grok 4.20の優れたパフォーマンス)、リスク管理(例:ポジション保有時間、レバレッジ制御)、プロンプト戦略がパフォーマンスに影響を与える重要な要素であることを示している。
- インフラの課題:完全な自律性(自己資金調達、実行)の実現にはまだブレークスルーが必要であり、戦略の混雑、プライバシーと透明性のトレードオフ、およびSybil攻撃などのリスクが存在する。
- 評価フレームワークの欠如:現在、包括的なエージェント評価基準が不足しており、異なる市場条件におけるパフォーマンス、データソースの信頼性、セキュリティアーキテクチャに注目する必要がある。
- 将来の発展方向:ERC-8004などの標準はオンチェーンでの評判と協業の確立を目指しているが、信頼できるインフラの構築が、エージェントの大規模な採用と市場シェア獲得の鍵となるだろう。
原文著者:DWF Ventures
原文翻訳:深潮 TechFlow
ガイド:AIエージェントはすでにDeFi取引量の約5分の1を占めており、収益最適化のようなルールが明確なシナリオでは確かに人間を上回るパフォーマンスを示しています。しかし、完全に自律的な取引となると、最先端のAIのパフォーマンスは最先端の人間の5分の1にも満たないのが現状です。この研究は、DeFiにおける様々なシナリオでのAIの実際のパフォーマンスを分析しており、自動化取引に関心を持つすべての人にとって一読の価値があります。

核心ポイント
自動化およびエージェント活動は現在、すべてのオンチェーン活動の約19%を占めていますが、真のエンドツーエンドの自律性はまだ実現されていません。
収益最適化などの狭く明確に定義されたユースケースでは、エージェントは人間やボットよりも優れたパフォーマンスを示しています。しかし、取引などの多面的な行動については、人間のパフォーマンスがエージェントを上回っています。
エージェント間では、モデル選択とリスク管理が取引パフォーマンスに最も大きな影響を与えます。
エージェントが大規模に採用されるにつれて、Sybil攻撃、戦略の混雑、プライバシーとのトレードオフなど、信頼と実行に関する複数のリスクが存在します。
エージェント活動の継続的成長
過去1年間、エージェント活動は着実に成長し、取引量と取引数が増加しています。Coinbaseのx402プロトコルが主要な発展を牽引し、Visa、Stripe、Googleなどのプレイヤーも参入し、独自の標準を発表しています。現在構築されているインフラの大部分は、2つのシナリオにサービスを提供することを目的としています:エージェント間のチャネル、または人間によってトリガーされるエージェント呼び出しです。
ステーブルコイン取引は広くサポートされていますが、現在のインフラは依然として従来の決済ゲートウェイを基盤として依存しており、これは中央集権的な相手方への依存を意味します。したがって、エージェントが自己資金調達、自己実行を行い、変化する条件に応じて継続的に最適化する「完全自律」の最終段階はまだ実現されていません。

エージェントはDeFiにとって完全に新しい概念ではありません。長年にわたり、ボットによる自動化がオンチェーンプロトコルに存在し、MEVの捕捉やコードなしでは実現できない超過収益の獲得を行ってきました。これらのシステムは、頻繁に変化したり追加の監督を必要としない、明確に定義されたパラメータの下で非常にうまく機能します。しかし、市場は時間とともにより複雑になってきました。ここに、新世代のエージェントが参入する場面が見られます。過去数ヶ月間、オンチェーンはこのような活動の実験場となっています。
エージェントの実際のパフォーマンス
レポートによると、エージェント活動は指数関数的に成長しており、2025年以降17,000以上のエージェントが起動されています。自動化/エージェント活動の総量は、すべてのオンチェーン活動の19%以上をカバーすると推定されています。これは驚くべきことではありません。なぜなら、ステーブルコイン転送量の76%以上がボットによって生成されていると推定されているからです。これは、DeFiにおけるエージェント活動には大きな成長の余地があることを示しています。
エージェントの自律性には幅広い範囲があり、高度な人間の監督を必要とするチャットボット式の体験から、目標入力に基づいて市場状況に適応した戦略を策定できるエージェントまで様々です。ボットと比較して、エージェントにはいくつかの重要な利点があります。これには、新情報にミリ秒単位で応答・実行する能力、および同じ厳格性を維持しながら数千の市場にカバレッジを拡大する能力が含まれます。
現在、ほとんどのエージェントはまだアナリストから副操縦士のレベルに留まっています。なぜなら、それらのほとんどはまだテスト段階にあるからです。

収益最適化:エージェントが優れたパフォーマンス
流動性提供は、自動化が頻繁に行われている分野であり、エージェントが保有する総TVLは3,900万ドルを超えています。この数字は主に、ユーザーが直接エージェントに預け入れた資産を測定するものであり、金庫を経由した資本は含まれません。
Giza Techはこの分野で最大のプロトコルの一つであり、昨年末に主要なDeFiプロトコルの収益獲得を強化することを目的とした最初のエージェントアプリケーションARMAを立ち上げました。これは1,900万ドル以上の管理資産を集め、400億ドル以上のエージェント取引量を生み出しています。取引量と管理資産総額の高い比率は、エージェントが資本を頻繁にリバランスし、より高い収益獲得を実現できることを示しています。資本が契約に預け入れられると、実行は自動化されるため、ユーザーにはほとんど監督を必要としないシンプルなワンクリック体験を提供します。
ARMAのパフォーマンスは測定可能なほど優れており、USDCに対して9.75%を超える年率換算利回りを生み出しています。追加のリバランス手数料とエージェントの10%のパフォーマンス手数料を考慮しても、利回りはAaveやMorphoでの通常の貸出を上回っています。それでも、スケーラビリティは依然として重要な問題です。これらのエージェントは、主要なDeFiプロトコルの規模を管理または拡大するための実戦テストをまだ受けていないからです。
取引:人間が大幅にリード
しかし、取引のようなより複雑な行動については、結果ははるかに多様です。現在の取引モデルは、人間が定義した入力に基づいて動作し、事前に設定されたルールに従って出力を提供します。機械学習は、モデルが明示的な再プログラミングなしに新情報に基づいて行動を更新できるようにすることでこれを拡張し、副操縦士の役割に進化させます。完全自律エージェントが加わることで、取引の状況は大きく変化するでしょう。
すでにいくつかのエージェント間および人間対エージェントの取引コンテストが開催されており、結果はモデル間に大きな差異があることを示しています。Trade XYZは、自社プラットフォームに上場している株式を対象に、人間対エージェントの取引コンテストを開催しました。各口座には1万ドルの初期資金があり、レバレッジや取引頻度に制限はありませんでした。結果は圧倒的に人間に有利で、トップクラスの人間のパフォーマンスはトップクラスのエージェントを5倍以上上回りました。
一方、Nof1はモデル間のエージェント取引コンテストを開催し、いくつかのモデル(Grok-4、GPT-5、Deepseek、Kimi、Qwen3、Claude、Gemini)を競わせ、資本保全から最大レバレッジまで、異なるリスク設定をテストしました。結果は、パフォーマンスの差異を説明するのに役立ついくつかの要因を明らかにしました:
保有期間:強い相関関係があり、平均して各ポジションを2〜3時間保有するモデルは、頻繁に反転するモデルを大きく上回りました。
期待値:これはモデルが平均して取引ごとに利益を上げているかどうかを測定します。興味深いことに、上位3つのモデルだけが正の期待値を持っており、これはほとんどのモデルが利益を出す取引よりも損失を出す取引の方が多いことを意味します。
レバレッジ:平均6〜8倍の低いレバレッジレベルは、10倍以上のレバレッジを実行するモデルよりも優れたパフォーマンスを示し、高いレベルは損失を加速させることが証明されました。
プロンプト戦略:Monk Modeはこれまでで最高のパフォーマンスを示したモデルであり、Situational Awarenessは最も低いパフォーマンスでした。モデルの特性に基づくと、リスク管理に焦点を当て、外部ソースを少なくすることがより良いパフォーマンスにつながることが示されています。
基盤モデル:Grok 4.20は、異なるプロンプト戦略において他のモデルを22%以上大きく上回るパフォーマンスを示し、平均して利益を上げた唯一のモデルでした。
ロング/ショートの選好、取引規模、信頼度スコアなどの他の要因は、十分なデータがないか、モデルのパフォーマンスと正の相関があることが証明されませんでした。全体として、結果は、エージェントが明確に定義された制約内でより良いパフォーマンスを示す傾向があることを示しており、これは目標設定において人間が依然として非常に必要とされていることを意味します。

エージェントの評価方法
エージェントがまだ初期段階にあることを考慮すると、現在包括的な評価フレームワークはありません。過去のパフォーマンスは通常、エージェントを評価するためのベンチマークとして使用されますが、それらは強力なエージェントパフォーマンスのより強い兆候を提供する基本要因の影響を受けます。
異なるボラティリティ下でのパフォーマンス:条件が悪化した際の規律ある損失管理を含みます。これは、エージェントが取引の収益性に影響を与えるオフチェーン要因を識別できることを示します。
透明性とプライバシー:双方にそれぞれトレードオフがあります。透明なエージェントは、積極的にコピートレードされる可能性がある場合、戦略的に優位性を持つことは基本的にありません。秘密のエージェントは、作成者が内部で抽出するリスクに直面します。作成者は自分のユーザーを簡単にフロントランできる可能性があります。
情報源:エージェントがアクセスするデータソースは、エージェントがどのように意思決定を行うかを決定するために重要です。ソースが信頼でき、単一の依存関係がないことを確認することが不可欠です。
セキュリティ:スマートコントラクトの監査と適切な資金保管アーキテクチャを持ち、ブラックスワンイベント時にバックアップ対策があることを確保することが重要です。
エージェントの次のステップ
エージェントを大規模に採用するためには、インフラの面でまだ多くの作業が必要です。これは、エージェントの信頼と実行に関する重要な問題に帰着します。自律エージェントの行動にはガードレールがなく、資金管理の失敗の例がすでに発生しています。
ERC-8004は2026年1月に立ち上げられ、自律エージェントが相互に発見し、検証可能な評判を確立し、安全に協力できる最初のオンチェーン登録簿となりました。これはDeFiのコンポーザビリティの重要な解放です。なぜなら、信頼スコアがスマートコントラクト自体に埋め込まれているため、エージェントとプロトコル間の許可不要の活動が可能になるからです。これは、評判の共謀やSybil攻撃などのセキュリティ上の脆弱性が依然として発生する可能性があるため、エージェントが常に非悪意のある方法で動作することを保証するものではありません。したがって、保険、セキュリティ、エージェントの経済的ステーキングなどの分野で、まだ埋めるべき大きな余地があります。
DeFiにおけるエージェント活動が拡大するにつれて、戦略の混雑が構造的リスクとなります。イールドファーミングは最も明確な先例であり、戦略が普及するにつれてリターンは圧縮されます。同じダイナミクスがエージェント取引にも適用される可能性があります。多数のエージェントが類似のデータでトレーニングされ、類似の目標を最適化する場合、それらは類似のポジションと類似のエグジットシグナルに収束するでしょう。
コーネル大学が2026年1月に発表したCoinAlg論文は、この問題の一形態を形式化しました。透明なエージェントは、その取引が予測可能でフロントランされる可能性があるため、アービトラージの対象となります。秘密のエージェントはこのリスクを回避しますが、作成者が自分のユーザーに対して情報優位性を保持し、不透明性によって本来保護されるべき内部知識を通じて価値を抽出できるという異なるリスクを導入します。
エージェント活動は加速し続けるだけでなく、今日構築されるインフラがオンチェーン金融の次の段階がどのように機能するかを決定します。エージェントの使用率が増加するにつれて、それらは自己反復し、ユーザーの好みに適応するようにより鋭敏になります。したがって、主要な差別化要因は、信頼できるインフラに帰着し、それらが最大の市場シェアを獲得するでしょう。


