深圳 국산 칩이 성공적으로 1조6000억 매개변수 AI 대규모 모델을 훈련하다
2026-06-05 01:59
Odaily星球日报讯 최근, 심천 허타오 학원 AI 훈련 플랫폼 프로젝트 팀은 하얼빈 공업대학(심천), 심천시 빅데이터 연구원, 화웨이 관련 팀과 협력하여 심천지능 AI 컴퓨팅 플랫폼과 함께 국산 컴퓨팅 파워 대규모 모델 훈련을 위한 공동 연구를 진행했습니다. 昇腾 910C 국산 AI 컴퓨팅 클러스터를 기반으로 1조 6000억 매개변수 대규모 모델 DeepSeek-V4-Pro의 전체 매개변수 후속 훈련을 완료했습니다.
이번 실험은 국산 컴퓨팅 플랫폼에서 해당 수준의 모델 훈련을 완료한 글로벌 제3자 기관으로서 중요한 경험을 축적했으며, 국산 AI 칩이 세계적 수준의 초대형 매개변수 모델 훈련을 지원할 수 있음을 입증했습니다. 기술 적용 관점에서 볼 때, 기존 모델을 호출하여 비즈니스 추론을 수행하는 것과 처음부터 모델의 전체 매개변수 훈련을 완료하는 것은 서로 다른 기술 단계에 속하며, 기술 난이도와 하드웨어 요구 사항에서 명백한 차이가 있습니다. 이번 실험 결과는 국산 AI 컴퓨팅 파워가 이미 최고 수준의 대규모 모델 훈련 작업을 수행할 수 있으며, 관련 기술 경로의 실현 가능성을 보여주었습니다. (심천 발표)
