深圳国产芯片成功训练万亿级AI大模型
Odaily Planet Daily News: Gần đây, nhóm dự án nền tảng đào tạo AI của Học viện Hà Đào Thâm Quyến, phối hợp với Đại học Công nghệ Cáp Nhĩ Tân (Thâm Quyến), Viện nghiên cứu dữ liệu lớn Thâm Quyến và nhóm liên quan của Huawei, cùng hợp tác với nền tảng sức mạnh tính toán AI của Thâm Trí Thành, đã thực hiện nghiên cứu tổng lực hướng tới đào tạo mô hình lớn trên nền tảng sức mạnh tính toán nội địa. Dựa vào cụm sức mạnh tính toán AI nội địa Thăng Đằng 910C, nhóm đã hoàn thành quá trình hậu đào tạo toàn tham số cho mô hình lớn DeepSeek-V4-Pro với 1,6 nghìn tỷ tham số.
Thực tiễn này đã tích lũy kinh nghiệm quan trọng cho các tổ chức bên thứ ba trên toàn cầu trong việc hoàn thành đào tạo mô hình cấp độ này trên nền tảng sức mạnh tính toán nội địa, đồng thời khẳng định rằng chip AI nội địa có thể hỗ trợ công việc đào tạo mô hình siêu lớn đẳng cấp thế giới. Từ góc độ ứng dụng công nghệ, việc gọi các mô hình hiện có để thực hiện suy luận nghiệp vụ khác biệt về mặt kỹ thuật so với việc hoàn thành đào tạo toàn tham số mô hình từ đầu, hai việc này có sự khác biệt rõ rệt về độ khó kỹ thuật và yêu cầu phần cứng. Kết quả thử nghiệm lần này cho thấy, sức mạnh tính toán AI nội địa đã có thể đảm nhận các nhiệm vụ đào tạo mô hình lớn hàng đầu, các lộ trình công nghệ liên quan đều có tính khả thi. (Thâm Quyến phát hành)
