Sự cố ngừng hoạt động của Cloudflare đã phá vỡ bộ lọc phi tập trung của Web3.
Bài viết gốc của Odaily Planet Daily ( @OdailyChina )
Tác giả|Wenser ( @wenser2010 )
Đêm qua, Cloudflare, nhà cung cấp dịch vụ cơ sở hạ tầng internet lớn nhất thế giới, đã gặp sự cố ngừng hoạt động kéo dài nhiều giờ, khiến nhiều trang web trên toàn thế giới, bao gồm X và OpenAI, bị sập và một số trang web chính thức của các dự án tiền điện tử cũng bị ảnh hưởng.
Hôm nay, Cloudflare đã đưa ra tuyên bố chính thức rằng: "Sự cố ngừng hoạt động trên diện rộng này không phải do tấn công mạng bên ngoài, mà do tệp cấu hình không chính xác được tạo sau khi điều chỉnh quyền cơ sở dữ liệu, gây ra sự cố bất thường trong hệ thống proxy cốt lõi và gây ra sự cố ngừng hoạt động ở nhiều sản phẩm, bao gồm CDN, dịch vụ bảo mật, Workers KV, Turnstile và Access. Đây là sự cố nghiêm trọng nhất kể từ năm 2019."
Quan trọng hơn, sự cố này một lần nữa phơi bày một thực tế: ngay cả các mạng lưới blockchain phi tập trung vẫn đang chật vật để thoát khỏi sự phụ thuộc vào cơ sở hạ tầng internet tập trung . Odaily sẽ cung cấp một cái nhìn tổng quan và phân tích ngắn gọn về sự kiện này bên dưới.
Cloudflare: Mạng internet toàn cầu "Jerusalem" đã bị sập, 1/5 mạng internet bị ngừng hoạt động.
Trước khi thảo luận về sự cố ngừng hoạt động ngày hôm qua, chúng ta cần phải hiểu tại sao Cloudflare lại quan trọng đối với Internet.
Theo trang web chính thức của Cloudflare, 20% website trên toàn thế giới được Cloudflare bảo vệ; công ty này chặn tới 234 tỷ mối đe dọa mạng mỗi ngày. Hơn nữa, trang web này cũng cho thấy 30% các công ty trong danh sách Fortune Global 1000 đang sử dụng dịch vụ của Cloudflare, bao gồm Twitter và OpenAI (đã đề cập trước đó), cũng như nền tảng thương mại điện tử Shopify, tập đoàn truyền thông Thomson Reuters, công ty nội dung truyền thông Canva, và Riot Games, nhà phát triển trò chơi thể thao điện tử Liên Minh Huyền Thoại. Discord, một sản phẩm cộng đồng rất quen thuộc với những người đam mê tiền điện tử, cũng là một ví dụ điển hình về cơ sở khách hàng của Cloudflare.


Hơn nữa, Cloudflare đóng vai trò là tuyến đầu bảo mật và mạng phân phối nội dung (CDN) cho nhiều trang web độc lập và doanh nghiệp. Sự cố Cloudflare cũng giống như một vụ tai nạn giao thông trên các xa lộ internet toàn cầu, gây ra tình trạng tắc nghẽn hoàn toàn và ngăn người dùng internet vượt qua nó để kết nối đến máy chủ chính của trang web. Thậm chí còn vô lý hơn, vì các kỹ sư chính thức ban đầu đã nhầm lẫn nó với một cuộc tấn công DDoS, ngay cả Downdetector, một trang web theo dõi trạng thái trang web theo thời gian thực, cũng không thể truy cập được trong một thời gian, tạo ra tình huống kỳ lạ "Tôi bị sập, nhưng tôi không thể phát hiện ra mình bị sập". Sự cố này kéo dài hơn 3 giờ, và việc khôi phục hoàn toàn mất hơn 5 giờ. Tác động rộng khắp và sức tàn phá của nó đã khiến nhiều người gọi đây là "sự cố nghiêm trọng nhất về cơ sở hạ tầng internet cho đến nay trong năm 2025".
Sáng nay, Cloudflare đã công bố báo cáo phân tích sự cố ngừng hoạt động chính thức, nêu rõ sự cố ngừng hoạt động quy mô lớn vào ngày 18 tháng 11 không phải do tấn công mạng bên ngoài, mà là do tệp cấu hình không chính xác được tạo sau khi điều chỉnh quyền cơ sở dữ liệu. Điều này đã gây ra lỗi bất thường trong hệ thống proxy lõi, gây gián đoạn cho nhiều sản phẩm, bao gồm CDN, dịch vụ bảo mật, Workers KV, Turnstile và Access. Đây là sự cố nghiêm trọng nhất kể từ năm 2019. Ban đầu, đội ngũ Cloudflare đã đánh giá sai đây là một cuộc tấn công DDoS, nhưng cuối cùng đã khắc phục sự cố bằng cách khôi phục tệp cấu hình cũ. Tất cả các dịch vụ liên quan đã được khôi phục hoàn toàn vào lúc 01:06 sáng giờ Bắc Kinh ngày 19 tháng 11.
Đáp lại "sai lầm nội bộ" này, Giám đốc công nghệ của Cloudflare, Dane Knecht, phát biểu trên X : "Chúng tôi đã làm khách hàng và cộng đồng internet thất vọng; đây không phải là một cuộc tấn công, mà là một vấn đề phát sinh sau khi chúng tôi thực hiện các thay đổi cấu hình thường xuyên trong nội bộ; bất kỳ thời gian ngừng hoạt động nào cũng không được chấp nhận và chúng tôi sẽ làm mọi cách có thể để giành lại niềm tin đó."
Điều đáng chú ý là đây không phải là lần đầu tiên Cloudflare gây ra "sự cố ngừng hoạt động tập thể" trên internet, nhưng đây là sự cố nghiêm trọng nhất trong gần sáu năm.
Vào năm 2013, một lỗi định tuyến BGP đã khiến toàn bộ mạng lưới của Cloudflare "biến mất" khỏi internet, khiến toàn bộ DNS và các dịch vụ ngừng hoạt động trong khoảng một giờ;
Năm 2019, một biểu thức chính quy thảm khốc trong quá trình cập nhật quy tắc lưu trữ WAF đã kích hoạt tình trạng CPU bị chậm lại theo cấp số nhân trên toàn cầu, khiến một nửa internet trả về lỗi 502/503 trong vòng 30 phút. Theo Cloudflare, đây cũng là sự cố ngừng hoạt động nội bộ nghiêm trọng nhất do sự cố gây ra của Cloudflare.
Vào năm 2020, lỗi cạn kiệt CPU trong quá trình triển khai mã thông thường đã trở nên trầm trọng hơn, khiến mức sử dụng CPU trên các nút biên toàn cầu tăng đột biến lên 100% và lưu lượng truy cập giảm mạnh gần 50% trong khoảng 30 phút.
Vào năm 2022, trong quá trình thay đổi cấu hình mạng xương sống, 19 trung tâm dữ liệu có lưu lượng truy cập cao đã vô tình bị ngắt kết nối cùng lúc, khiến hơn 50% trang web trên toàn thế giới gặp phải tình trạng mất kết nối trong gần 1 giờ 40 phút.
Vào năm 2023, một trung tâm dữ liệu lõi đơn tại Portland, Hoa Kỳ đã bị mất điện hoàn toàn (nguồn điện lưới + tất cả máy phát điện đều bị hỏng), dẫn đến tình trạng không sử dụng được Bảng điều khiển/API và các dịch vụ phân tích trên diện rộng.
Vào tháng 6 năm nay, một lỗi cơ sở hạ tầng lưu trữ của bên thứ ba đã gây ra sự suy giảm toàn cầu của Workers KV, ảnh hưởng đến nhiều sản phẩm bao gồm Workers, R2 và Zero Trust trong 2 giờ 28 phút.
Việc ngừng hoạt động và ngừng hoạt động liên tục chắc chắn khiến chúng ta phải xem xét một câu hỏi mà từ lâu đã bị "câu chuyện Web3", "công nghệ blockchain" và "mạng phi tập trung" né tránh: Liệu mạng phi tập trung có thực sự có thể thay thế cơ sở hạ tầng tập trung như Cloudflare không?
Cloudflare không có "phiên bản thay thế Web3": mạng blockchain phi tập trung không thể hoạt động nếu không có các dịch vụ cơ bản tập trung.
Câu trả lời tất nhiên là không.
Trước đây, mỗi khi internet gặp sự cố do các dịch vụ tập trung gây ra, thị trường tiền điện tử lại tràn ngập những lời bàn tán "dịch vụ tập trung không đáng tin cậy" và "mạng lưới phi tập trung mới là tương lai". Tháng 7 năm nay, đúng dịp kỷ niệm 10 năm hoạt động ổn định của Ethereum, Vitalik Buterin thậm chí còn lấy câu nói "Ethereum chưa bao giờ gặp sự cố hay dừng hoạt động" của Ethereum làm ví dụ để làm nổi bật những lợi thế độc đáo của mạng lưới phi tập trung. Tuy nhiên, trên thực tế, cơ sở hạ tầng internet như Cloudflare hầu như không có "giải pháp thay thế" nào trong số các cơ sở hạ tầng Web3 hiện tại. Sau đây là phân tích so sánh được biên soạn bởi Grok 4.1:

Sự thật khắc nghiệt và thực tế hơn là phần lớn các dự án Web3 đều dựa vào dịch vụ của Cloudflare để chạy .
- Phần front-end được lưu trữ trên Vercel/Netlify (nền tảng Cloudflare).
- Các nút RPC được bảo vệ bằng Cloudflare Gateway
- Trang web chính thức, tài liệu, liên kết ví và các trang web khác đều dựa trên Cloudflare.
Sẽ không ngoa khi nói rằng nếu không có Cloudflare, 90% dự án Web3 sẽ bị đình trệ.
Có thể meme này hơi muộn, nhưng nó đã xuất hiện rồi: Liệu có phải một nhân viên mới của Cloudflare đang bị đổ lỗi không? Đây chỉ là trò đùa của cư dân mạng thôi.
Một điều thú vị khác về sự cố Cloudflare là meme lặp lại xuất hiện sau đó—một người dùng đã đăng rằng họ đã thực hiện một số "cập nhật nhỏ" vào ngày đầu tiên tại Cloudflare, và sau đó cư dân mạng bắt đầu hành trình tạo meme của riêng họ, thậm chí còn tạo ra meme "Người mới đến của Cloudflare".
- "Vào ngày đầu tiên làm việc tại Cloudflare, sếp tôi đã bảo tôi đi kiểm tra phòng máy chủ và chúc tôi may mắn!"
- "Ngày đầu tiên làm việc tại Cloudflare của tôi thật tuyệt vời và tôi đã được thăng chức!"
Tất nhiên, đây chỉ là một meme; cư dân mạng được đề cập ở trên trước đó đã đăng một tweet meme về việc "tham gia Amazon Web Services". Nhưng từ những meme này, rõ ràng là cư dân mạng không còn ngạc nhiên trước việc cơ sở hạ tầng tập trung bị đóng cửa nữa, và khi đối mặt với những tình huống như vậy, họ không còn lựa chọn nào khác ngoài việc nói đùa và chờ đợi.
Tóm lại, mạng lưới phi tập trung và dịch vụ tập trung không loại trừ lẫn nhau mà là sự kết hợp giữa chúng.
Tóm lại, chúng ta phải thừa nhận rằng các giải pháp dịch vụ internet tập trung vẫn vượt trội hơn hẳn các dịch vụ tập trung về hiệu suất, chi phí, bảo mật và tính dễ sử dụng. Ý tưởng rằng cơ sở hạ tầng phi tập trung và mạng lưới blockchain có thể thay thế hoàn toàn các dịch vụ tập trung để xử lý lượng dữ liệu khổng lồ và lưu lượng dịch vụ đám mây của các trang web AI như X, Spotify và OpenAI chỉ là một giấc mơ viển vông.
Nhiều lần ngừng hoạt động của Cloudflare không phải là cơ hội để áp dụng rộng rãi các mạng phi tập trung, nhưng chúng khiến chúng ta phải suy ngẫm về sự khác biệt và lợi thế độc đáo của cơ sở hạ tầng phi tập trung Web3.
Một vài gã khổng lồ tập trung vẫn nắm quyền kiểm soát internet, và chúng ta vẫn còn một chặng đường dài phía trước để đạt được một hệ sinh thái mạng phi tập trung thực sự. Trong tương lai gần, khoảng 5-10 năm tới, mạng phi tập trung và dịch vụ tập trung sẽ vẫn là một phương pháp kết hợp, chứ không phải là một lựa chọn "hoặc này hoặc kia".
Tuy nhiên, lần tới khi Cloudflare gặp sự cố, có lẽ chúng ta nên bớt hả hê vì "các dịch vụ tập trung cũng chẳng tốt" và suy nghĩ kỹ hơn về việc "khi nào chúng ta thực sự có thể không cần phải phụ thuộc vào nó nữa".
- 核心观点:去中心化网络仍依赖中心化基础设施。
- 关键要素:
- Cloudflare宕机致全球20%网站瘫痪。
- 内部配置错误引发核心系统异常。
- 90% Web3项目依赖其服务运行。
- 市场影响:暴露Web3对中心化服务的脆弱依赖。
- 时效性标注:长期影响


