Odaily Thông tin Planet Daily Mô hình suy luận AI mã nguồn mở R1 mới của DeepSeek đã gây ra đợt bán tháo cổ phiếu Nvidia và đưa ứng dụng tiêu dùng của nó lên đầu App Store của Apple.
Tháng trước, DeepSeek cho biết họ đã đào tạo một mô hình chỉ trong hai tháng với chi phí khoảng 5,5 triệu USD, sử dụng trung tâm dữ liệu với khoảng 2.000 GPU Nvidia H800. Tuần trước, DeepSeek đã xuất bản một bài báo cho thấy hiệu suất của mô hình mới nhất của họ phù hợp với các mô hình suy luận tiên tiến nhất thế giới. Các mô hình này đang được đào tạo trong các trung tâm dữ liệu chi hàng tỷ đô la cho các chip AI rất đắt tiền và nhanh hơn của Nvidia.
Phản ứng đối với mô hình hiệu suất cao, chi phí thấp của DeepSeek đã lan rộng khắp ngành công nghệ. Ví dụ, cựu Giám đốc điều hành Intel Pat Gelsinger đã đăng trên X: "Cảm ơn nhóm DeepSeek."
Gelsinger gần đây đã từ chức Giám đốc điều hành của Intel và hiện giữ chức chủ tịch công ty khởi nghiệp IPO của riêng mình, Gloo. Anh ấy rời đi vào tháng 12 sau bốn năm làm việc tại Intel, nơi anh ấy đang cố gắng bắt kịp Nvidia với GPU AI thay thế của Intel, Gaudi 3 AI.
Ông viết rằng DeepSeek nên nhắc nhở ngành công nghệ về ba bài học quan trọng nhất: chi phí thấp hơn có nghĩa là khả năng sáng tạo được áp dụng rộng rãi hơn trong điều kiện hạn chế và nguồn mở sẽ thắng lợi; DeepSeek sẽ giúp thiết lập lại thế giới ngày càng khép kín của công việc mô hình AI cơ bản. "
Gelsinger cũng tiết lộ rằng R1 ấn tượng đến mức Gloo đã quyết định không sử dụng OpenAI và trả tiền cho nó. Gloo đang xây dựng một dịch vụ AI có tên Kallm sẽ cung cấp chatbot và các dịch vụ khác. (TechCrunch)
