BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

樂天發佈「日本最大高性能AI模型」,其配置文件顯示基於DeepSeek V3架構

2026-03-17 09:34

Odaily星球日報訊 據1M AI News監測,樂天集團發佈開源模型 Rakuten AI 3.0,並稱其為「日本最大高性能 AI 模型」。該模型採用 MoE 架構,總參數 6710 億,每次推理激活 370 億參數,上下文窗口為 128K,針對日語場景進行優化,在多項日語基準測試中表現優於 GPT-4o。

該模型為日本經濟產業省與新能源產業技術綜合開發機構(NEDO)推進的 GENIAC 項目成果之一,獲得部分算力支持。樂天未披露基礎模型來源,僅表示基於開源社區成果構建。

社區在 HuggingFace 模型文件中發現,其 config.json 包含「deepseek_v3」及相關架構字段,且參數規模與上下文配置與 DeepSeek V3 一致,顯示該模型或基於 DeepSeek V3 進行日語微調。