BTC
ETH
HTX
SOL
BNB
查看行情
简中
繁中
English
日本語
한국어
ภาษาไทย
Tiếng Việt

DeepSeek開源V4模型,參數規模達1.6兆

2026-04-24 03:11

Odaily星球日報訊 DeepSeek 發布 V4 系列開源模型預覽版,採用 MIT 許可,權重已上線 Hugging Face 與 ModelScope。

該系列包含兩款 MoE 模型,其中 V4-Pro 總參數約 1.6 兆、單 token 啟動 490 億參數,V4-Flash 總參數 2840 億、啟動 130 億參數,均支援 100 萬 token 上下文。官方表示,相較 V3.2 版本,其在長文本推理中顯存佔用與計算開銷均顯著降低。