DeepSeek phát hành mô hình V4 mã nguồn mở, với quy mô tham số lên tới 1,6 nghìn tỷ
2026-04-24 03:11
Tin tức từ Odaily: DeepSeek phát hành phiên bản xem trước của dòng mô hình mã nguồn mở V4, sử dụng giấy phép MIT, trọng số đã được tải lên Hugging Face và ModelScope.
Dòng sản phẩm này bao gồm hai mô hình MoE, trong đó V4-Pro có tổng số tham số khoảng 1,6 nghìn tỷ, kích hoạt 49 tỷ tham số cho mỗi token, V4-Flash có tổng số tham số 284 tỷ, kích hoạt 13 tỷ tham số, cả hai đều hỗ trợ ngữ cảnh lên tới 1 triệu token. Theo thông báo chính thức, so với phiên bản V3.2, mô hình này giảm đáng kể mức sử dụng bộ nhớ và chi phí tính toán trong suy luận văn bản dài.
