Ứng dụng khách Ethereum Prysm gặp sự cố trên mạng chính: cạn kiệt tài nguyên dẫn đến mất mát số lượng lớn các khối và chứng thực.
Theo Odaily Planet Daily, nhóm Prysm đã phát hành một báo cáo tóm tắt sự cố mạng chính cho biết rằng trong phiên Fusaka của mạng chính Ethereum vào ngày 4 tháng 12, hầu hết các nút beacon của Prysm đều hết tài nguyên trong khi xử lý các chứng thực cụ thể, dẫn đến việc chúng không thể phản hồi yêu cầu của trình xác thực một cách kịp thời và gây ra một lượng lớn các khối và chứng thực bị thiếu.
Sự cố ảnh hưởng đến các kỷ nguyên từ 411439 đến 411480, tổng cộng 42 kỷ nguyên. Có 248 khối bị thiếu trong tổng số 1344 vị trí, tỷ lệ thiếu khoảng 18,5%. Tỷ lệ tham gia mạng giảm xuống 75% tại một thời điểm, và các trình xác thực mất khoảng 382 ETH tiền thưởng chứng thực. Nguyên nhân gốc rễ là do Prysm nhận được các chứng thực từ các nút có thể không đồng bộ với mạng chính. Các chứng thực này tham chiếu đến gốc khối của kỷ nguyên trước đó. Để xác minh tính hợp lệ của chúng, Prysm đã liên tục phát lại trạng thái kỷ nguyên cũ và thực hiện các chuyển đổi kỷ nguyên tốn kém, khiến các nút cạn kiệt tài nguyên trong điều kiện đồng thời cao. Lỗi liên quan bắt nguồn từ Prysm PR 15965, đã được triển khai trên mạng thử nghiệm một tháng trước đó nhưng không gây ra tình huống tương tự.
Giải pháp tạm thời chính thức là bật tham số `--disable-last-epoch-target` trong phiên bản 7.0.0. Các phiên bản tiếp theo 7.0.1 và 7.1.0 bao gồm bản vá lỗi dài hạn sử dụng trạng thái đầu để xác minh chứng thực, tránh việc phát lại nhiều lần các trạng thái lịch sử. Prysm cho biết vấn đề đã dần được giải quyết sau 4:45 UTC ngày 4 tháng 12, với sự tham gia của mạng lưới phục hồi lên hơn 95% vào kỷ nguyên 411480.
Nhóm Prysm chỉ ra rằng sự cố này nhấn mạnh tầm quan trọng của sự đa dạng khách hàng. Nếu một khách hàng chiếm hơn một phần ba tổng số, điều đó có thể dẫn đến việc không thể chấm dứt tạm thời; nếu vượt quá hai phần ba, sẽ có nguy cơ chuỗi chấm dứt không hợp lệ. Họ cũng đã xem xét các vấn đề về việc giao tiếp không rõ ràng liên quan đến việc chuyển đổi tính năng và việc môi trường thử nghiệm không mô phỏng được các nút bất đồng bộ quy mô lớn, và sẽ cải thiện chiến lược thử nghiệm và quản lý cấu hình trong tương lai.
