楽天が「日本最大の高性能AIモデル」を発表、その設定ファイルはDeepSeek V3アーキテクチャに基づくことを示す
2026-03-17 09:34
Odailyの報道によると、1M AI Newsのモニタリング情報に基づき、楽天グループはオープンソースモデル「Rakuten AI 3.0」をリリースし、これを「日本最大の高性能AIモデル」と称している。このモデルはMoEアーキテクチャを採用し、総パラメータ数は6710億、推論ごとに370億のパラメータが活性化され、コンテキストウィンドウは128Kで、日本語シーンに最適化されており、複数の日本語ベンチマークテストにおいてGPT-4oを上回る性能を示している。
このモデルは、経済産業省と新エネルギー・産業技術総合開発機構(NEDO)が推進するGENIACプロジェクトの成果の一つであり、一部の計算リソース支援を受けている。楽天は基盤モデルの出所を明らかにしておらず、オープンソースコミュニティの成果に基づいて構築されたとだけ述べている。
コミュニティがHuggingFaceのモデルファイルで発見したところによると、そのconfig.jsonには「deepseek_v3」および関連するアーキテクチャフィールドが含まれており、パラメータ規模とコンテキスト設定はDeepSeek V3と一致しており、このモデルがDeepSeek V3を基に日本語ファインチューニングを行った可能性を示している。
