小米とMiniMaxが同時に大技を放ち、Agent価格戦争が正式に始動

区块律动BlockBeats

特邀专栏作者

2026-03-20 04:00

この記事は約2236文字で、全文を読むには約4分かかります

ブランドでも宣伝でもなく、8日間で開発者に足で投票させた。

AI要約

展開

核心的な視点：中国のAI企業MiniMaxと小米が最近発表した2つのAgent大規模モデルは、国際的なトップモデルをはるかに下回るAPI価格設定で、それに近い性能を実現し、「自己反復進化」と「大規模パラメータ」という2つの異なる技術発展の道筋を代表している。
重要な要素：
1. 顕著な価格優位性：MiniMax M2.7とMiMo V2-ProのAPI出力価格はそれぞれ1.2ドル/百万トークンと3ドル/百万トークンで、Claude Opus（25ドル）のわずか1/21と1/8である。
2. 第一陣への仲間入りを果たした性能：SWE-benchなどの主流Agent評価において、2つのモデルは国際的なトップモデル（Claude Sonnet、GPT-5.3-Codexなど）との差がわずかで、「価格-性能のシザーズ差」を形成している。
3. 全く異なる技術路線：MiMo V2-Proは超兆規模パラメータの「力技で奇跡を起こす」路線を採用し、長文脈処理を強化；M2.7は「自己反復進化」メカニズムに重点を置き、自律最適化ループを通じて能力を向上させる。
4. 差別化された反復戦略：MiniMaxは小刻みに素早く進める高頻度反復（約49日で1バージョン）を採用し、小米はパラメータとアーキテクチャの大幅な飛躍を伴う長周期反復を選択している。
5. 革新的な発表戦略：MiMo V2-Proは匿名モデル「Hunter Alpha」としてOpenRouterプラットフォームで8日間ブラインドテストを行い、性能と価格で大量の呼び出しを集めて首位に立ち、その後初めて正体を明かした。

3月18日と19日、2つの中国企業が相次いでそれぞれのAgent向け大規模モデルを発表しました。国内AIスタートアップのMiniMaxはM2.7を、小米傘下の大規模モデルチームMiMoはV2-Proをリリースしました。両モデルはAgentベンチマークで世界トップクラスに入りましたが、API出力の価格設定はそれぞれClaude Opus 4.6の1/21と1/8です。

同じ週に出てきたカードですが、手札は全く異なります。これらは全く異なる2つの技術路線を代表し、Agent時代の2つの未来に賭けています。

同じ試験、1/17の学費

まず最も直感的な比較を見てみましょう。

OpenRouterおよび各社公式価格ページのデータによると、API出力価格（100万トークンあたり）で、MiniMax M2.7は1.2ドル、MiMo-V2-Proは3ドルです。参考までに、Claude Opus 4.6の出力価格は25ドル、GPT-5.2は14ドル、Claude Sonnet 4.6は15ドルです。

価格差は桁違いですが、能力差はそうではありません。SWE-bench Verified（現在コードエンジニアリング能力を測る最も主流なベンチマーク）では、MiMo-V2-Proは78%を獲得し、Sonnet 4.6は79.6%で、差は2ポイント未満です。M2.7のSWE-Proスコアは56.22%で、GPT-5.3-Codexと同等です。VIBE-Pro（エンドツーエンドプロジェクト納品能力）では、M2.7は55.6%を獲得し、Opus 4.6の水準に近づいています。

この図のポイントは、どちらが高いか低いかではありません——各社のベンチマーク体系は完全に一致しておらず、直接比較には注意が必要です。重要なのはその「価格-性能のシザーズ差」です：国産Agentモデルはすでに同じ能力帯に食い込んでいますが、全く異なる価格帯に立っています。

1兆パラメータ vs 自己進化

価格は表面に過ぎません。2社は全く異なる2枚の切り札を繰り出しました。

MiMo-V2-Proは「力技で奇跡を起こす」路線を歩んでいます。小米公式発表によると、V2-Proは総パラメータ数1兆以上、活性化パラメータ42B、100万トークンの超長文コンテキストをサポートしています。その中核的な革新はHybrid Attention混合注意メカニズムで、スライディングウィンドウ注意（SWA）とグローバル注意（GA）の比率を7:1に調整しています——前世代のV2-Flashは5:1でした。このアーキテクチャにより、モデルは長文書処理や複数ツールの並列呼び出しといったAgentシナリオにおいてより安定しています。PinchBench（Agentツール呼び出し能力評価）では、MiMo-V2-Proは84%を獲得しました。

M2.7は全く異なる道を歩みました。MiniMaxが3月18日に発表した公式技術ブログによると、M2.7のパラメータ数は公開されていませんが、「自己反復進化」メカニズムを披露しています：モデルは100ラウンド以上の最適化ループを自律的に実行し、失敗軌跡の分析、修正計画、自身のコードアーキテクチャの変更、評価実行、再ループを含み、最終的に内部評価セットで30%の性能向上を実現しました。MLE Bench Lite（機械学習コンペティション難易度評価）の22問の高難度問題で、M2.7は金9、銀5、銅1を獲得し、平均メダル獲得率は66.6%でした。

5つの次元から見ると、2つの路線の切っ先は全く異なる方向を向いています：MiMo-V2-Proはコンテキスト長とコードエンジニアリングの次元で明らかに優位に立ち、M2.7はオフィス自動化と自己反復能力で差をつけています。MiniMaxの同技術ブログによると、M2.7はGDPval-AA（オフィス文書処理評価）でELO 1495を獲得し、オープンソースモデル首位となり、40以上の複雑スキルをカバーするMM-Clawテストでは97%のスキル遵守率を維持しました。

5ヶ月で4バージョン

2社は技術路線が異なるだけでなく、イテレーションのペースも全く異なります。

公開リリース記録によると、MiniMaxは2025年10月のM2リリースから2026年3月のM2.7リリースまで、5ヶ月で4バージョンをイテレーションし、平均49日ごとにメジャーバージョンを更新しています。そのうちM2.5からM2.7の間隔は約30日しかありません。

小米MiMoのペースは異なります：2025年4月にMiMo-7B（7Bパラメータのオープンソース推論モデル）をリリースし、同年12月にV2-Flash（総パラメータ309B）、2026年3月にV2-Pro（総パラメータ1T）をリリースしました。世代間のパラメータ規模の飛躍は大きいですが、バージョン間隔も長くなっています。

MiniMaxは小さなステップで素早く走ることを選択し、各イテレーションの幅は大きくありませんが頻度が非常に高く、M2.7の自己反復メカニズム自体が「継続的進化」のために設計されています。小米は力を蓄えて一撃を加えることを選択し、各バージョンはパラメータ規模とアーキテクチャの大幅な飛躍です。

匿名8日間、OpenRouterで頂点に

技術路線以外に、小米の発表戦略も業界の慣例を打ち破りました。

Reuters報道によると、3月11日、Hunter Alphaという匿名モデルが世界最大のAPI集約プラットフォームOpenRouterに登場しました。ブランドの裏付けも、発表会も、技術ブログもありません。そのAPI価格設定は極めて低いですが、性能は驚くほど強力でした。

コミュニティはその正体を推測し始めました。Republic Worldや複数の技術メディア報道によると、最も主流な推測はDeepSeek V4で、MiMoチーム責任者の羅福莉氏が以前DeepSeekで研究に従事していたためです。呼び出し量は急速に増加し、匿名期間中の総呼び出し量は1兆トークンを突破し、OpenRouter週間ランキングで1位に躍り出ました。