小米とMiniMaxが同時に大技を放ち、Agent価格戦争が正式に始動
- 核心的な視点:中国のAI企業MiniMaxと小米が最近発表した2つのAgent大規模モデルは、国際的なトップモデルをはるかに下回るAPI価格設定で、それに近い性能を実現し、「自己反復進化」と「大規模パラメータ」という2つの異なる技術発展の道筋を代表している。
- 重要な要素:
- 顕著な価格優位性:MiniMax M2.7とMiMo V2-ProのAPI出力価格はそれぞれ1.2ドル/百万トークンと3ドル/百万トークンで、Claude Opus(25ドル)のわずか1/21と1/8である。
- 第一陣への仲間入りを果たした性能:SWE-benchなどの主流Agent評価において、2つのモデルは国際的なトップモデル(Claude Sonnet、GPT-5.3-Codexなど)との差がわずかで、「価格-性能のシザーズ差」を形成している。
- 全く異なる技術路線:MiMo V2-Proは超兆規模パラメータの「力技で奇跡を起こす」路線を採用し、長文脈処理を強化;M2.7は「自己反復進化」メカニズムに重点を置き、自律最適化ループを通じて能力を向上させる。
- 差別化された反復戦略:MiniMaxは小刻みに素早く進める高頻度反復(約49日で1バージョン)を採用し、小米はパラメータとアーキテクチャの大幅な飛躍を伴う長周期反復を選択している。
- 革新的な発表戦略:MiMo V2-Proは匿名モデル「Hunter Alpha」としてOpenRouterプラットフォームで8日間ブラインドテストを行い、性能と価格で大量の呼び出しを集めて首位に立ち、その後初めて正体を明かした。
3月18日と19日、2つの中国企業が相次いでそれぞれのAgent向け大規模モデルを発表しました。国内AIスタートアップのMiniMaxはM2.7を、小米傘下の大規模モデルチームMiMoはV2-Proをリリースしました。両モデルはAgentベンチマークで世界トップクラスに入りましたが、API出力の価格設定はそれぞれClaude Opus 4.6の1/21と1/8です。
同じ週に出てきたカードですが、手札は全く異なります。これらは全く異なる2つの技術路線を代表し、Agent時代の2つの未来に賭けています。
同じ試験、1/17の学費
まず最も直感的な比較を見てみましょう。

OpenRouterおよび各社公式価格ページのデータによると、API出力価格(100万トークンあたり)で、MiniMax M2.7は1.2ドル、MiMo-V2-Proは3ドルです。参考までに、Claude Opus 4.6の出力価格は25ドル、GPT-5.2は14ドル、Claude Sonnet 4.6は15ドルです。
価格差は桁違いですが、能力差はそうではありません。SWE-bench Verified(現在コードエンジニアリング能力を測る最も主流なベンチマーク)では、MiMo-V2-Proは78%を獲得し、Sonnet 4.6は79.6%で、差は2ポイント未満です。M2.7のSWE-Proスコアは56.22%で、GPT-5.3-Codexと同等です。VIBE-Pro(エンドツーエンドプロジェクト納品能力)では、M2.7は55.6%を獲得し、Opus 4.6の水準に近づいています。
この図のポイントは、どちらが高いか低いかではありません——各社のベンチマーク体系は完全に一致しておらず、直接比較には注意が必要です。重要なのはその「価格-性能のシザーズ差」です:国産Agentモデルはすでに同じ能力帯に食い込んでいますが、全く異なる価格帯に立っています。
1兆パラメータ vs 自己進化
価格は表面に過ぎません。2社は全く異なる2枚の切り札を繰り出しました。
MiMo-V2-Proは「力技で奇跡を起こす」路線を歩んでいます。小米公式発表によると、V2-Proは総パラメータ数1兆以上、活性化パラメータ42B、100万トークンの超長文コンテキストをサポートしています。その中核的な革新はHybrid Attention混合注意メカニズムで、スライディングウィンドウ注意(SWA)とグローバル注意(GA)の比率を7:1に調整しています——前世代のV2-Flashは5:1でした。このアーキテクチャにより、モデルは長文書処理や複数ツールの並列呼び出しといったAgentシナリオにおいてより安定しています。PinchBench(Agentツール呼び出し能力評価)では、MiMo-V2-Proは84%を獲得しました。
M2.7は全く異なる道を歩みました。MiniMaxが3月18日に発表した公式技術ブログによると、M2.7のパラメータ数は公開されていませんが、「自己反復進化」メカニズムを披露しています:モデルは100ラウンド以上の最適化ループを自律的に実行し、失敗軌跡の分析、修正計画、自身のコードアーキテクチャの変更、評価実行、再ループを含み、最終的に内部評価セットで30%の性能向上を実現しました。MLE Bench Lite(機械学習コンペティション難易度評価)の22問の高難度問題で、M2.7は金9、銀5、銅1を獲得し、平均メダル獲得率は66.6%でした。

5つの次元から見ると、2つの路線の切っ先は全く異なる方向を向いています:MiMo-V2-Proはコンテキスト長とコードエンジニアリングの次元で明らかに優位に立ち、M2.7はオフィス自動化と自己反復能力で差をつけています。MiniMaxの同技術ブログによると、M2.7はGDPval-AA(オフィス文書処理評価)でELO 1495を獲得し、オープンソースモデル首位となり、40以上の複雑スキルをカバーするMM-Clawテストでは97%のスキル遵守率を維持しました。
5ヶ月で4バージョン
2社は技術路線が異なるだけでなく、イテレーションのペースも全く異なります。
公開リリース記録によると、MiniMaxは2025年10月のM2リリースから2026年3月のM2.7リリースまで、5ヶ月で4バージョンをイテレーションし、平均49日ごとにメジャーバージョンを更新しています。そのうちM2.5からM2.7の間隔は約30日しかありません。
小米MiMoのペースは異なります:2025年4月にMiMo-7B(7Bパラメータのオープンソース推論モデル)をリリースし、同年12月にV2-Flash(総パラメータ309B)、2026年3月にV2-Pro(総パラメータ1T)をリリースしました。世代間のパラメータ規模の飛躍は大きいですが、バージョン間隔も長くなっています。
MiniMaxは小さなステップで素早く走ることを選択し、各イテレーションの幅は大きくありませんが頻度が非常に高く、M2.7の自己反復メカニズム自体が「継続的進化」のために設計されています。小米は力を蓄えて一撃を加えることを選択し、各バージョンはパラメータ規模とアーキテクチャの大幅な飛躍です。

匿名8日間、OpenRouterで頂点に
技術路線以外に、小米の発表戦略も業界の慣例を打ち破りました。
Reuters報道によると、3月11日、Hunter Alphaという匿名モデルが世界最大のAPI集約プラットフォームOpenRouterに登場しました。ブランドの裏付けも、発表会も、技術ブログもありません。そのAPI価格設定は極めて低いですが、性能は驚くほど強力でした。
コミュニティはその正体を推測し始めました。Republic Worldや複数の技術メディア報道によると、最も主流な推測はDeepSeek V4で、MiMoチーム責任者の羅福莉氏が以前DeepSeekで研究に従事していたためです。呼び出し量は急速に増加し、匿名期間中の総呼び出し量は1兆トークンを突破し、OpenRouter週間ランキングで1位に躍り出ました。

3月19日未明、小米が正体を明かしました:Hunter AlphaはMiMo-V2-Proでした。Reutersの同記事によると、正体公開後、小米の香港株は一時5.8%上昇しました。
これは国産大規模モデルが初めて世界的なプラットフォームで純粋なブラインドテストによって自らを証明した瞬間です。ブランドにも、宣伝にも頼らず、8日間で開発者に足で投票させました。


