BTC
ETH
HTX
SOL
BNB
View Market
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

楽天が「日本最大の高性能AIモデル」を発表、その設定ファイルはDeepSeek V3アーキテクチャに基づくことを示す

2026-03-17 09:34

Odailyの報道によると、1M AI Newsのモニタリング情報に基づき、楽天グループはオープンソースモデル「Rakuten AI 3.0」をリリースし、これを「日本最大の高性能AIモデル」と称している。このモデルはMoEアーキテクチャを採用し、総パラメータ数は6710億、推論ごとに370億のパラメータが活性化され、コンテキストウィンドウは128Kで、日本語シーンに最適化されており、複数の日本語ベンチマークテストにおいてGPT-4oを上回る性能を示している。

このモデルは、経済産業省と新エネルギー・産業技術総合開発機構(NEDO)が推進するGENIACプロジェクトの成果の一つであり、一部の計算リソース支援を受けている。楽天は基盤モデルの出所を明らかにしておらず、オープンソースコミュニティの成果に基づいて構築されたとだけ述べている。

コミュニティがHuggingFaceのモデルファイルで発見したところによると、そのconfig.jsonには「deepseek_v3」および関連するアーキテクチャフィールドが含まれており、パラメータ規模とコンテキスト設定はDeepSeek V3と一致しており、このモデルがDeepSeek V3を基に日本語ファインチューニングを行った可能性を示している。