DeepSeek 오픈소스 V4 모델 출시, 파라미터 규모 1.6조
2026-04-24 03:11
Odaily 행성일보 소식에 따르면, DeepSeek이 V4 시리즈 오픈소스 모델 프리뷰 버전을 출시했습니다. MIT 라이선스가 적용되며, 가중치는 Hugging Face 및 ModelScope에 업로드되었습니다.
해당 시리즈는 두 가지 MoE 모델을 포함합니다. V4-Pro는 총 파라미터 약 1.6조 개, 단일 토큰 활성화 파라미터 490억 개이며, V4-Flash는 총 파라미터 2840억 개, 활성화 파라미터 130억 개로, 모두 100만 토큰 컨텍스트를 지원합니다. 공식 측은 V3.2 버전과 비교하여 장문 추론 시 메모리 사용량과 계산 비용이 현저히 감소했다고 밝혔습니다.
