Anthropic cảnh báo rủi ro tự cải thiện AI: Claude đã tự động tạo ra 80% mã nguồn công ty
Odaily Planet Daily News, công ty trí tuệ nhân tạo Anthropic đã đưa ra cảnh báo về những rủi ro đáng kể có thể đến từ Tự cải thiện đệ quy (Recursive Self-Improvement, RSI). Tuần trước, Anthropic thông báo rằng mô hình AI Claude của họ hiện có thể tạo ra khoảng 80% mã nguồn của công ty, điều mà công ty gọi là tín hiệu quan trọng cho thấy AI đã bước vào giai đoạn "tự cải thiện" – nghĩa là mô hình có thể thiết kế thế hệ hệ thống AI tiếp theo mà không cần sự can thiệp của con người.
Khái niệm tự cải thiện đệ quy gần đây đã thu hút sự chú ý rộng rãi tại Thung lũng Silicon. Tháng trước, OpenAI đã tổ chức một hội nghị liên quan tại San Francisco, thu hút nhiều nhà nghiên cứu thảo luận về tiềm năng và rủi ro của việc AI tự cải thiện. Tuyên bố của Anthropic nhấn mạnh rằng, khi năng lực AI tăng lên nhanh chóng, việc giám sát các hành vi tiềm ẩn không kiểm soát được và xây dựng các cơ chế an toàn ngày càng trở nên cấp thiết. (The Information)
