原著者: PSEトレーディングアナリスト@Minta
Key Insights
AI エージェントは、LLM の一般的な大規模モデルに基づいたツールで、開発者とユーザーが独立して対話できるアプリケーションを直接構築できるようにします。
将来の AI トラックの主なパターンは、「一般的な大規模モデル + 垂直アプリケーション」になる可能性があります。AI エージェントのエコロジカルニッチは、一般的な大規模モデルと Dapps を接続するミドルウェアであるため、AI エージェントの低コスト堀があり、ネットワーク効果の創出と改善に依存する必要がある ユーザーの粘り強さが長期的な競争力を強化します。
この記事では、Web3ゲームトラックにおける「一般的な大型モデル、垂直アプリケーションエージェント、生成AIアプリケーション」の開発について整理します。その中には、Generative AI テクノロジーと組み合わせることで、短期的にヒットゲームを生み出す大きな可能性があります。
01 技術紹介
今年爆発的に普及した AGI (Artificial General Intelligence) テクノロジーの中で、Large Language Model (LLM) は絶対的な主役です。 OpenAIコア技術スタッフAndrej KarpathyそしてLilian Wengまた、LLM ベースの AI エージェントが AGI 分野の次の重要な開発方向であることも表明されており、多くのチームが LLM 駆動の人工知能エージェント (AI-Agent) システムも開発しています。簡単に言えば、AI エージェントは、自動運転、音声認識、ゲーム戦略などのさまざまなタスクやインタラクションを実行するために、大量のデータと複雑なアルゴリズムを使用して人間の思考と意思決定のプロセスをシミュレートするコンピューター プログラムです。Abacus.aiこの図は AI エージェントの基本原理を明確に示しており、手順は次のとおりです。
知覚とデータ収集: データ入力、または AI エージェントは知覚システム (センサー、カメラ、マイクなど) を通じてゲームのステータス、画像、音声などの情報とデータを取得します。
状態表現: データは、ニューラル ネットワークに入力できるように、ベクトルやテンソルに変換するなど、エージェントが理解できる形式に処理して表現する必要があります。
ニューラル ネットワーク モデル: 通常、ディープ ニューラル ネットワーク モデルは、画像処理用の畳み込みニューラル ネットワーク (CNN)、シーケンス データ処理用のリカレント ニューラル ネットワーク (RNN)、またはセルフ アテンションなどのより高度なモデルなど、意思決定と学習に使用されます。力の仕組み(トランス)など
強化学習: エージェントは環境との対話を通じて最適な行動戦略を学習します。さらに、エージェントの動作原理には、戦略ネットワーク、価値ネットワーク、トレーニングと最適化、探索と活用も含まれます。たとえば、ゲーム シナリオでは、戦略ネットワークはゲーム状態を入力してアクションの確率分布を出力でき、バリュー ネットワークは状態の値を推定でき、エージェントは環境と対話して学習アルゴリズムを継続的に強化して最適化できます。戦略と価値のネットワークを構築し、より完璧な結果を生み出します。
Source:blog.abacus.ai
要約すると、AI エージェントは理解、意思決定、行動が可能なインテリジェントなエンティティであり、ゲームを含むさまざまな分野で重要な役割を果たすことができます。 OpenAIコア技術スタッフLilian Wengによって書かれたLLM Powered Autonomous Agents》AI エージェントの原理についての非常に包括的な紹介であり、その中で、記事では非常に興味深い実験である生成エージェントについて言及しています。
Generative Agents(略して GA) は、LLM テクノロジーを使用して 25 の仮想キャラクターを生成する「シムズ」ゲームからインスピレーションを得ており、各キャラクターは LLM によってサポートされるエージェントによって制御され、サンドボックス環境で生きて対話します。 GA の設計は非常にスマートで、LLM とメモリ、計画、リフレクション機能を組み合わせており、エージェント プログラムが以前の経験に基づいて意思決定を行い、他のエージェントと対話できるようになります。
この記事では、エージェントがポリシー ネットワーク、価値ネットワーク、および環境との相互作用に基づいて意思決定パスを継続的にトレーニングおよび最適化する方法について詳しく説明します。
原理は次のとおりです。 Memory Stram は、エージェントのすべてのインタラクティブなエクスペリエンスを記録する長期記憶モジュールです。取得モデル (取得) は、エージェントの意思決定 (計画) を支援するために、関連性、鮮度、重要性に基づいたエクスペリエンス (取得された記憶) を提供します。反映メカニズム (Reflect) は過去のイベントを要約し、エージェントの将来のアクションをガイドします。 Plan と Reflect は連携して、エージェントが反省と環境情報を実際の行動に変換するのを支援します。
Source:LLM Powered Autonomous Agents
この興味深い実験は、新しい社会的行動の生成、情報の拡散、関係記憶 (2 人の仮想キャラクターがトピックについて話し続けるなど)、社会活動の調整 (パーティーを主催したり、他の仮想キャラクターを招待したりするなど) などの AI エージェントの機能を示しています。 )等。全体として、AI-Agent は非常に興味深いツールであり、ゲームへの応用については詳しく調べる価値があります。
02 テクノロジートレンド
2.1 AI 追跡トレンド
ABCDEの投資調査パートナーLaoBai私はかつて、AI の次の発展に関するシリコンバレーのベンチャーキャピタル界の判断を次のように要約しました。
垂直モデルはなく、大型モデル + 垂直アプリケーションのみです。
携帯電話などのエッジ デバイスからのデータは障壁となる可能性がありますが、エッジ デバイスに基づく AI は機会となる可能性もあります。
Context の長さは将来的に質的な変化を引き起こす可能性があります (現在 AI のメモリとしてベクトル データベースが使用されていますが、コンテキストの長さはまだ十分ではありません)。
つまり、業界の一般的な開発ルールから見ると、大型汎用モデルは重すぎて汎用性が強いため、大型汎用モデルの分野では常に車輪の再発明を行う必要がない。代わりに、大規模な一般モデルを垂直フィールドに適用することに重点を置く必要があります。
同時に、エッジデバイスは、通常、クラウドコンピューティングセンターやリモートサーバーに依存せず、ローカルでデータ処理と意思決定を実行する端末デバイスを指します。エッジ デバイスは多様であるため、AI エージェントをデプロイしてデバイス上で実行し、デバイス データを合理的に取得する方法は課題ですが、それは新たな機会でもあります。
最後に、コンテキストに関する問題も大きな注目を集めています。簡単に言えば、LLM のコンテキストにおける Context は情報量として理解でき、Context 長はデータの次元数として理解できます。電子商取引 Web サイトに、ユーザーが特定の製品を購入する可能性を予測するために使用されるビッグ データ モデルがあるとします。この場合、Contextにはユーザーの閲覧履歴、購入履歴、検索履歴、ユーザー属性などの情報を含めることができます。コンテキスト長とは、上海の30歳男性ユーザーによる競合商品の購入履歴や最近の購入頻度、最近の閲覧履歴などの特徴情報が重畳される次元を指します。コンテキストの長さが増加すると、モデルがユーザーの購入決定に影響を与える要因をより包括的に理解できるようになります。
現在のコンセンサスは、AI メモリとしてのベクトル データベースの現在の使用ではコンテキストの長さが不十分であるが、コンテキストの長さは将来定性的に変化し、LLM モデルはより長く複雑なコンテキストを処理および理解するためのより高度な方法を模索できるということです。の情報です。想像を超えるさらなる応用シナリオが登場しています。
2.2 AIエージェントの動向
Folius Venturesゲームトラックにおける AI エージェントのアプリケーション モデルは次のように要約されています。
出典: Folius Ventures - ゲーム特集: Web3 ゲームの北極星を探す旅
図の 1 は LLM モデルで、主にユーザーの意図を従来のキーボード/クリック入力から自然言語入力に変換し、ユーザーの入力しきい値を下げる役割を果たします。
図の2はAI Agentと統合されたフロントエンドDappで、ユーザーに機能的なサービスを提供すると同時に、端末からユーザーの習慣やデータを収集することもできます。
図の 3 はさまざまな種類の AI エージェントであり、アプリケーション内機能やボットなどの形で直接存在できます。
一般に、コードベースのツールである AI エージェントは、アプリケーション機能を拡張するための Dapp の基礎となるプログラムとして機能し、プラットフォーム (大規模なモデルと垂直アプリケーションをリンクするミドルウェア) の成長触媒として機能します。
ユーザー シナリオの観点から見ると、AI エージェントを統合する可能性が最も高い Dapps は、十分にオープンなソーシャル アプリ、チャットボット、ゲームである可能性が高く、既存の Web2 トラフィック エントランスをよりシンプルでユーザー フレンドリーな AI+ に変換することもできます。 AIエージェントによるWeb3参入、つまり業界 Web3のユーザー敷居を下げる議論が行われてきました。
産業発展の法則に基づいて、AI エージェントが配置されるミドルウェア層は、多くの場合、ほとんど外堀のない非常に競争の激しいトラックになります。したがって、AI エージェントは、B2C のニーズに合わせてエクスペリエンスを継続的に改善することに加えて、ネットワーク効果を生み出したり、ユーザーの粘着性を生み出したりすることで、堀を改善することもできます。
03 トラックマップ
Web3 ゲームの分野に AI を適用するさまざまな試みが行われており、これらの試みは次のカテゴリに分類できます。
一般モデル: 一部のプロジェクトは、一般的な AI モデルを構築し、Web3 プロジェクトのニーズに適したニューラル ネットワーク アーキテクチャと一般モデルを見つけることに重点を置いています。
垂直型アプリケーション: 垂直型アプリケーションは、ゲーム内の特定の問題を解決したり、特定のサービスを提供したりするように設計されており、通常はエージェント、ボット、ボットキットの形式で表示されます。
生成 AI アプリケーション: 大規模モデルに対応する最も直接的なアプリケーションはコンテンツ生成であり、ゲーム トラック自体がコンテンツ産業であるため、ゲーム分野での生成 AI アプリケーションは非常に注目に値します。仮想世界で要素、キャラクター、タスク、ストーリーを自動生成し、ゲーム戦略、意思決定、さらにはゲーム内の生態系の自動進化まで自動生成することが可能となり、ゲームをより多様かつ奥深いものにしています。
AI ゲーム: 現在、AI テクノロジーを統合したゲームが数多く存在しており、さまざまなアプリケーション シナリオが用意されています。
3.1 一般的な大型モデル
現在、Web3 には、QTM 定量トークン モデルなど、経済モデル設計と経済生態開発のためのシミュレーション モデルがすでにあります。アウトライアーベンチャーズDr. Achim StruveETHCCのスピーチでは、経済モデル設計に関するいくつかのアイデアが言及されました。たとえば、経済システムの堅牢性を考慮して、プロジェクト チームは LLM モデルを通じてデジタル ツインを作成し、エコシステム全体を 1:1 でシミュレートできます。
下の写真QTM(定量的トークン モデル) は、AI 主導の推論モデルです。 QTM では、10 年の固定シミュレーション時間を使用し、各時間ステップは 1 か月です。各タイムステップの開始時にトークンがエコシステムに放出されるため、モデルにはインセンティブ モジュール、トークン帰属モジュール、エアドロップ モジュールなどが含まれます。その後、これらのトークンはいくつかのメタ バケットに入れられ、そこからさらに詳細な一般ユーティリティの再分配が再度実行されます。次に、これらの公益商品からの報酬支払いなどを定義します。オフチェーン ビジネスのような側面もあり、破棄または再購入できるなど、ビジネスの一般的な資金調達状況も考慮されます。また、ユーザーの採用率を測定したり、ユーザーの採用を定義したりすることもできます。
もちろん、モデルの出力品質は入力品質に依存するため、QTM を使用する前に十分な市場調査を実施して、より正確な入力情報を取得する必要があります。しかし、QTM モデルはすでに Web3 経済モデルにおける AI 駆動モデルの非常に実用的な応用であり、QTM モデルを使用して操作難易度が低い 2C/2B アプリケーションを作成するプロジェクト関係者も多く、プロジェクト関係者の敷居を下げています。それを使うために。
3.2 垂直塗布エージェント
垂直アプリケーションは主にエージェントの形式で存在します。エージェントは、ボット、ボットキット、仮想アシスタント、インテリジェントな意思決定支援システム、さまざまな自動データ処理ツールなど、さまざまな形式で存在する場合があります。一般に、AI エージェントは OpenAI の一般的なモデルを最下層として採用し、それを他のオープンソースまたは自社開発のテクノロジー (テキスト読み上げ (TTS) など) と組み合わせて、FineTune (トレーニングの一種) 用の特定のデータを追加します。機械学習と深層学習の分野) 技術の主な目的は、大規模なデータで事前トレーニングされたモデルをさらに最適化し、特定の分野で ChatGPT よりも優れたパフォーマンスを発揮する AI エージェントを作成することです。
現在、Web3 ゲームトラックで最も成熟したアプリケーションは NFT エージェントです。ゲーム界のコンセンサスは、NFT が Web3 ゲームの重要な部分を占めるに違いないということです。
イーサリアムエコシステムにおけるメタデータ管理テクノロジーの発展に伴い、プログラム可能な動的NFTが登場しました。 NFT 作成者は、アルゴリズムを通じて NFT 機能をより柔軟にすることができます。ユーザーにとっては、ユーザーとNFTの間でより多くのインタラクションが可能となり、生成されたインタラクティブデータが情報源となります。 AI エージェントは、インタラクション プロセスを最適化し、インタラクティブ データのアプリケーション シナリオを拡張して、NFT エコシステムにさらなるイノベーションと価値を注入できます。
ケース 1: たとえば、Gelato の開発フレームワークを使用すると、開発者はロジックをカスタマイズして、オフチェーン イベントまたは特定の時間間隔に基づいて NFT メタデータを更新できます。 Gelato ノードは、特定の条件が満たされたときにメタデータの変更をトリガーするため、チェーン上の NFT の自動更新が可能になります。たとえば、このテクノロジーを使用して、スポーツ API からリアルタイムのゲームデータを取得し、アスリートが試合に勝ったときなど、特定の条件下で NFT のスキル特性を自動的にアップグレードすることができます。
Source:Gelato - The Ultimate Guide to Dynamic NFTs
ケース 2:PaimaDynamic NFT には Application Agent も提供されます。パイマの NFT 圧縮プロトコルは、L1 で最小限の NFT セットを作成し、L2 でゲームの状態に基づいてそれらを進化させ、プレーヤーにより詳細でインタラクティブなゲーム体験を提供します。たとえば、NFTはキャラクターの経験値、タスクの完了、装備、その他の要因に基づいて変化する可能性があります。
ケース 3:Mudulas Labsこれは非常によく知られた ZKML プロジェクトであり、NFT トラックのレイアウトもあります。 Mudulas は NFT シリーズ zkMon を立ち上げ、AI を通じて NFT を生成してチェーンにリリースすることができ、同時に zkp も生成され、ユーザーは zkp を使用して自分の NFT が対応する AI モデルから生成されたかどうかを確認できます。より包括的な情報については、以下を参照してください。Chapter 7.2: The World’s 1 st zkGAN NFTs。
3.3 生成型 AI アプリケーション
前述したように、ゲーム自体がコンテンツ産業であるため、AI-Agentは、不確実性の高いコンテンツを含め、短期間かつ低コストで大量のコンテンツを生成することができます。ダイナミックなゲームキャラクター等したがって、Generative AI はゲーム アプリケーションに非常に適しています。現在、ゲーム分野におけるジェネレーティブ AI の応用は、主に次の種類に分類できます。
AI によって生成されたゲーム キャラクター: たとえば、AI と戦ったり、AI がゲーム内の NPC のシミュレーションと制御を担当したり、AI を直接使用してキャラクターを生成したりすることもあります。
AI によって生成されたゲーム コンテンツ: タスク、ストーリー、プロップ、マップなどのさまざまなコンテンツが AI によって直接生成されます。
AI 生成のゲーム シーン クラス: AI を使用して、ゲーム世界の地形、風景、雰囲気を自動的に生成、最適化、拡張することをサポートします。
3.3.1 AI生成キャラクター
ケース 1: MyShell
MyShellチャット、会話練習、ゲーム、心理カウンセリングなど、ユーザーが自分のニーズに合わせて専用のボットを作成できるボット作成プラットフォームです。同時に、Myshell はテキスト読み上げ (TTS) テクノロジーを使用しており、わずか数秒の音声サンプルで誰かの声を模倣してボットを自動的に作成できます。さらに、MyShell は AutoPrompt を使用します。これにより、ユーザーは自分の考えを記述するだけで LLM モデルに指示を発行でき、プライベート大規模言語モデル (LLM) の基礎を築きます。
Myshell を使用しているユーザー急行、ボイスチャット機能は非常にスムーズで、GPTのボイスチャットよりも応答速度が速く、Live 2Dも備えています。
事例 2: AI アリーナ
AI ArenaAI バトル ゲームであり、ユーザーは LLM モデルを使用して自分のバトル エルフ (NFT) を継続的に訓練し、訓練したバトル エルフを PvP/PvE 戦場に送ることができます。戦闘モードは大乱闘スマッシュブラザーズに似ていますが、AI トレーニングによってさらに競争的な楽しみが追加されています。
AI Arena への投資は Paradigm が主導し、パブリック ベータ段階が開始されており、プレイヤーは無料でゲームに参加するか、NFT を購入してトレーニング強度を高めることができます。
ケース 3: オンチェーン チェス ゲーム Leela vs the World
Leela vs the WorldMudulas Labs によって開発されたチェス ゲームです。ゲームの当事者はAIと人間であり、チェスの局面は契約書に置かれます。プレイヤーはウォレットを通じて操作(契約とのやり取り)を行います。 AIは新たなチェスの局面を読み取り、判断し、計算プロセス全体のzkpを生成します.両方のステップはAWSクラウド上で完了し、zkpはチェーン上のコントラクトによって検証されます.検証が成功した後、チェスのゲーム契約は「ダウン」チェスと呼ばれます。
3.3.2 AIがゲームコンテンツを生成
事例1:AIタウン
AI Town は、スタンフォード大学の「Generative Agent」論文に触発された、a16z とそのポートフォリオ企業 Convex Dev とのコラボレーションです。 AI タウンは、町内の各 AI がインタラクションと経験に基づいて独自のストーリーを構築できる仮想の町です。
その中で、Convex バックエンド サーバーレス フレームワーク、Pinecone ベクター ストレージ、Clerk 認証、OpenAI 自然言語テキスト生成、Fly デプロイメントなどのテクノロジー スタックが使用されています。さらに、AI Town はすべてオープン ソースであり、ゲーム内開発者がフィーチャー データ、スプライト シート、タイルマップ視覚環境、テキスト生成プロンプト、ゲーム ルールとロジックなどを含むさまざまなコンポーネントをカスタマイズすることをサポートします。一般プレイヤーがAIタウンを体験できるほか、開発者もソースコードを利用してゲーム内やゲーム外のさまざまな機能を開発できるため、さまざまな用途に柔軟に対応できます。
したがって、AI Town 自体は AI によって生成されたコンテンツ ゲームですが、開発エコシステム、さらには開発ツールでもあります。
ケース 2: ポール
Paul は、AI ストーリーを生成し、チェーンに直接アップロードするフルチェーン ゲームのソリューション パスを特に提供する AI ストーリー ジェネレーターです。実装ロジックは、LLM に多くの先験的なルールを入力し、プレーヤーがそのルールに基づいて二次コンテンツを自動的に生成できるようにすることです。
現在、Paul Seidler を使用した Straylight プロトコルを使用してリリースされたゲームがあります。Straylightこれはマルチプレイヤー NFT ゲームです。中心となるゲームプレイは「Minecraft」のフルチェーン ゲーム バージョンです。プレイヤーは自動的に NFT をミントし、モデルによって入力された基本ルールに従って独自の世界を構築できます。
3.3.3 AI が生成したゲームシーン
ケース 1: パド研究所
Pahdo Labs は、Godot エンジン上に構築されたアニメ ファンタジー ロールプレイング ゲームおよびオンライン ゲーム作成プラットフォームである Halcyon Zero を現在開発しているゲーム開発スタジオです。このゲームは、社会の中心地として機能する賑やかな町を中心とした、幻想的なファンタジーの世界で行われます。
このゲームの非常に特別な点は、プレイヤーがゲームによって提供される AI 作成ツールを使用して、より多くの 3D 効果の背景を迅速に作成し、お気に入りのキャラクターをゲームに取り込むことができ、真に大量のゲーム UGC のためのツールとゲーム シーンを提供できることです。
ケース 2: カエディム
KaedimGenerative AI に基づく 3D モデル生成ツールはゲーム スタジオ向けに開発されており、ゲーム スタジオがニーズを満たすゲーム内 3D シーン/アセットを迅速にバッチ生成するのに役立ちます。 Kaedim の一般的な製品は現在も開発中であり、2024 年にゲーム スタジオに公開される予定です。
Kaedim の製品のコアロジックは AI-Agent のロジックとまったく同じで、一般的な大規模モデルをベースとして、チーム内のアーティストが適切なデータを継続的に入力し、エージェントの出力にフィードバックを与えます。機械学習を通じてモデルを継続的にトレーニングし、最終的に AI エージェントは要件を満たす 3D シーンを出力できます。
04 まとめ
この記事では、ゲーム分野における AI の応用について詳細な分析と概要を行います。一般に、一般的なモデルと生成 AI をゲームに適用することは、将来的には間違いなくスター ユニコーン プロジェクトにつながるでしょう。垂直型アプリケーションの外堀は低いものの、強力な先行者利益があり、その先行者利益を利用してネットワーク効果を生み出し、ユーザーの定着率を高めることができれば、想像力の余地は非常に大きくなります。また、生成AIは当然ゲームというコンテンツ産業にも適しており、現在多くのチームがGAをゲームに適用しようと試みており、このサイクルでGAを活用したヒットゲームが生まれる可能性が非常に高いです。
記事で言及されている方向性のいくつかに加えて、将来的には他の角度からの探求も行われます。例えば:
(1)データトラック+アプリケーション層:AIデータトラックは数十億ドル規模のユニコーンプロジェクトを生み出しており、データ+アプリケーション層の連携も想像力に富んでいます。
(2) Socialfi との統合: 革新的なソーシャル インタラクション方法の提供、AI エージェントを使用したコミュニティ ID 認証とコミュニティ ガバナンスの最適化、またはよりインテリジェントなパーソナライズされたレコメンデーションなど。
(3) エージェントの自動化と成熟により、将来の自律世界の主な参加者は人間になるのでしょうか、それともボットになりますか? DAU の 80% 以上がボットである Uniswap のようなチェーン上の自律的な世界は可能でしょうか?そうであれば、Web3 ガバナンスの概念を組み合わせたガバナンス エージェントも検討する価値があります。
05 参考資料
Exploring the Design Space for Dynamic NFTs
Generative Manufacturing: Transmuting Code intoPhysical Goods
検証可能な AI から構成可能な AI へ: zkML アプリケーション シナリオの考察
LD Capital: 最近人気になっているさまざまな種類の暗号ボットは、お金を稼ぐ方法ですか、それとも新しい投資の道ですか?
a16z がリリースしたオープンソース プロジェクト AI Town の概要: AI キャラクターが交流して生活できる仮想タウンの紹介