深圳国产芯片成功训练万亿级AI大模型
Odaily รายงานว่า เมื่อเร็วๆ นี้ ทีมงานโครงการแพลตฟอร์มฝึกอบรม AI ของ Shenzhen He Tao Academy ร่วมมือกับมหาวิทยาลัยฮาร์บินแห่งเทคโนโลยี (เซินเจิ้น), สถาบันวิจัยข้อมูลขนาดใหญ่แห่งเซินเจิ้น และทีมงานจาก Huawei รวมถึงการใช้แพลตฟอร์มพลังประมวลผล AI ของ Shenzhen Smart City Technology Development Group ได้ร่วมกันบุกเบิกการฝึกอบรมโมเดลขนาดใหญ่บนพลังประมวลผลในประเทศ โดยอาศัยคลัสเตอร์พลังประมวลผล AI ในประเทศ Ascend 910C ทำให้สามารถฝึกอบรมหลังการเทรนพารามิเตอร์เต็มรูปแบบของโมเดล DeepSeek-V4-Pro ซึ่งมีพารามิเตอร์ 1.6 ล้านล้านพารามิเตอร์ได้สำเร็จ
การปฏิบัติครั้งนี้ได้สั่งสมประสบการณ์สำคัญสำหรับการสำรวจที่เกี่ยวข้องขององค์กรภายนอกทั่วโลกในการฝึกอบรมโมเดลระดับดังกล่าวบนแพลตฟอร์มพลังประมวลผลในประเทศ และยังยืนยันว่าชิป AI ในประเทศสามารถรองรับการฝึกอบรมโมเดลพารามิเตอร์ขนาดใหญ่พิเศษระดับโลกได้ จากมุมมองของการประยุกต์ใช้เทคโนโลยี การเรียกใช้โมเดลที่มีอยู่เพื่อดำเนินการอนุมานทางธุรกิจ กับการฝึกอบรมพารามิเตอร์เต็มรูปแบบของโมเดลตั้งแต่เริ่มต้นนั้นเป็นคนละขั้นตอนทางเทคนิค ซึ่งมีความแตกต่างอย่างชัดเจนในด้านความยากทางเทคนิคและข้อกำหนดด้านฮาร์ดแวร์ ผลการทดสอบครั้งนี้ชี้ให้เห็นว่าพลังประมวลผล AI ในประเทศสามารถรับภาระงานฝึกอบรมโมเดลใหญ่ระดับแนวหน้าได้แล้ว และเส้นทางเทคนิคที่เกี่ยวข้องมีความเป็นไปได้ (รายงานโดย Shenzhen Release)
