Brian Armstrong: Sẽ đánh giá lại kiến trúc, thời gian gián đoạn trong tương lai có thể được rút ngắn đáng kể
Tin tức từ Odaily Planet Daily: Brian Armstrong, CEO của Coinbase, đã đăng trên nền tảng X rằng đêm qua Coinbase đã trải qua một sự cố gián đoạn, nguyên nhân cốt lõi là do nhiều bộ làm mát tại trung tâm dữ liệu AWS bị hỏng khiến phòng máy quá nóng. Hầu hết các hệ thống được thiết kế để có khả năng dự phòng trước sự cố của một Khu vực sẵn sàng (Availability Zone - AZ) đơn lẻ của AWS và hoạt động bình thường, nhưng các sàn giao dịch tập trung do được tối ưu hóa cho độ trễ thấp và lưu trữ khách hàng (colocation) nên không thể đạt được khả năng dự phòng này. Mặc dù có thể làm cho sàn giao dịch có khả năng chống chịu với sự cố của một khu vực sẵn sàng, nhưng điều này sẽ làm tăng độ trễ và phá vỡ cơ chế lưu trữ khách hàng.
Theo sự kiện này, chúng tôi sẽ đánh giá lại những sự đánh đổi này. Ít nhất là khi cần di chuyển khu vực sẵn sàng, thời gian gián đoạn sẽ có thể được rút ngắn đáng kể. Cảm ơn đội ngũ AWS và Coinbase đã làm việc suốt đêm để khắc phục sự cố, báo cáo kỹ thuật chi tiết sẽ được chia sẻ sau.
